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Patentanspruche 



10 



15 



20 



25 



30 



Verfahren zur Herstellung transf ormierter pf lanzlicher Zellen 
oder Organismen umfassend nachf olgende Schritte: 

a) Transformation einer Population pflanzlicher Zellen, 
wobei die Zellen besagter Population mindestens ein 
Markerprotein enthalten, das fur besagte Population 
direkt oder indirekt einen toxischen Effekt bewirken 
kann, mit mindestens einer zu insertierenden Nuklein- 
sauresequenz in Kombination mit mindestens einer Ver- 
bindung befahigt zur Verminderung der Expression, Menge, 
Aktivitat und/oder Funktion mindestens eines Marker- 
proteins , und 

b) Selektion von transf ormier ten pflanzlichen Zellen, die in 
ihrem Genom besagte Nukleinsauresequenz aufweisen und die 
infolge der Wirkung besagter Verbindung gegentiber nicht- 
transformierten Zellen einen Wachs turns vorteil haben, 

aus besagter Population pflanzlicher Zellen, wobei die 
Selektion unter Bedingungen durchgefiihrt wird, bei denen 
das Markerprotein seinen toxischen Effekt auf die nicht- 
transformierten Zellen austiben kann. 

Verfahren nach Anspruch 1, wobei das Markerprotein in der 
Lage ist, eine fur besagte Population pflanzlicher Zellen 
nicht-toxische Substanz X in eine fur besagte Population 
toxische Substanz Y direkt oder indirekt umzusetzen, 
umfassend nachf olgende Schritte: 



35 



40 



a) 



b) 



Transformation der Population pflanzlicher Zellen mit 
mindestens einer zu insertierenden Nukleinsauresequenz in 
Kombination mit mindestens einer Verbindung befahigt zur 
Verminderung der Expression, Menge, Aktivitat und/oder 
Funktion mindestens eines Markerproteins , und 

Behandlung besagter Population pflanzlicher Zellen mit 
der Substanz X in einer Konzentration, die infolge der 
Umsetzung durch das Markerprotein einen fur nicht-trans- 
formierte Zellen toxischen Effekt bedingt, und 



45 0093/471/2002 Ko/gb 26.07.2002 Sequ. + Zeichn. 



BASF Plant Science GmbH 20020471 



PP 53790 DE 




c) Selektion von trans formier ten pflanzlichen Zellen, die in 
ihrem Genom besagte Nukleinsauresequenz aufweisen und die 
infolge der Wirkung besagter Verbindung gegeniiber nicht- 
trans formier ten Zellen einen Wachstumsvorteil haben, 
aus besagter Population pflanzlicher Zellen, wobei die 
Selektion unter Bedingungen durchgefuhrt wird, bei denen 
das Markerprotein seinen toxischen Effekt auf die nicht- 
trans formier ten Zellen austiben kann. 

3. Verfahren nach Anspruch 2, wobei es sich bei der nicht- 
toxischen Substanz X urn eine Substanz handelt, die natur- 
licherweise in pflanzlichen Zellen oder Organismen nicht oder 
nur in Konzentration vorkommt, die im wesentlichen keinen 
toxischen Effekt bewirken konnen. 

4. Verfahren nach Anspruch 2 oder 3, wobei es sich bei der 
Substanz X urn eine Substanz handelt ausgewahlt aus der Gruppe 
bestehend aus Pro-Herbiziden, Pro-Ant ibiotika, Nukleosid- 
analoga, 5-Fluorocytosin, Auxinamidverbindungen, Naphthal- 
acetamid, Dihaloalkanen, Acyclovir, Ganciclovir, l,2-Deoxy-2- 
fluoro-P-D-arabinofuranosil-5-iodouracil, 6-Thioxanthin, 
Allopurinol, 6-Methylpurindeoxyribonukleosid, 4-Amino- 
pyrazolopyrimidin, 2-Amino-4-methoxy-butansaure, 5- (Tri- 
fluoromethyl) thioribose und Allylalkohol . 

5. Verfahren nach einem der Ansprtiche 1 bis 4, wobei das Marker- 
protein ausgewahlt ist aus der Gruppe bestehend aus Cytosin- 
deaminasen, Cytochrom P-450 Enyzmen, Indolessigsaurehydro- 
lasen, Haloalkandehalogenasen, Thymidinkinasen, Guaninphos- 
phoribosyltransferasen, Hypoxanthinphosphoribosyltrans- 
ferasen, Xanthinguaninphosphoribosyl trans f erasen, Purin- 
nukleosidphosphorylasen, Phosphonatmonoesterhydrolasen, 
Indolacetamidsynthasen, Indolacetamidhydrolasen, Adenin- 
phosphoribosyl trans f erasen, Methoxinindehydrogenasen, 
Rhizobitoxinsynthasen, 5-Methylthioribosekinasen und Alkohol- 
dehydr ogenas en . 

i. Verfahren nach einem der Ansprtiche 1 bis 5, wobei das Marker- 
protein kodiert wird durch 

a) eine Seguenz beschrieben durch die GenBank Accession- 
Nummer S56903, M32238, NC003308, AE009419, AB016260, 
NC002147 M26950, J02224, V00470, V00467, U10247, M13422, 
X00221, M60917, U44852, M61151, AF039169, AB025110, 
AF212863, AC079674, X77943, M12196, AF172282, X04049 
oder AF253472 
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b) eine Sequenz gemaS SEQ ID NO: 2, 4, 6, 8, 10, 12, 14, 16, 
18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 
46 oder 48 

5 7. Verfahren nach einem der Anspriiche 1 bis 6, wobei die Ver- 
bindung befahigt zur Verminderung der Expression, Menge, 
Aktivitat und/oder Funktion mindestens eines Markerproteins 
mindestens eine Nukleinsauresequenz , Ribonukleinsauresequenz , 
doppelstrangige Ribonukleinsauresequenz , antisense-Ribo- 

0 nukleinsauresequenz, Expressionskassette oder Polypeptid- 

sequenz umfasst. 

8. Verfahren nach einem der Anspriiche 1 bis 7, wobei die 

Verbindung befahigt zur Verminderung der Expression, Menge, 
5 Aktivitat und/oder Funktion mindestens eines Markerproteins 

ein DNA-Konstrukt ist, welches umfasst 

a) mindestens eine Expressionskassette geeignet zur 
Expression einer Ribonukleinsauresequenz und/oder 
0 gegebenenfalls eines Proteins, wobei besagte Nuklein- 

sauresequenz und/oder Protein in der Lage ist, die 
Expression, Menge, Aktivitat und/oder Funktion des 
Markerproteins zu vermindern , oder 

5 b) mindestens eine Sequenz, die eine teilweise oder voll- 

standige Deletion oder Inversion der Sequenz kodierend 
fur besagtes Markerprotein bewirkt und so eine Ver- 
minderung der Expression, Menge, Aktivitat und/oder 
Funktion des Markerproteins ermoglicht, sowie 

> - gegebenenfalls - weitere Funktionselemente, die 
besagte Deletion oder Inversion erleichtern und/oder 
f or dern , oder 

c) mindestens eine Sequenz, die eine Insertion in die 

> Sequenz kodierend fur das Markerprotein bewirkt und 
so eine Verminderung der Expression, Menge, Aktivitat 
und/oder Funktion des Markerproteins ermoglicht, sowie " 

- gegebenenfalls - weitere Funktionselemente, die besagte 
Insertion erleichtern und/oder fordern. 



40 



45 
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9. Verfahren nach einem der Anspruche 1 bis 8, wobei die Ver- 

minderung der Expression, Menge, Aktivitat und/oder Funktion 
des Markerproteins durch mindestens eines der nachf olgenden 
Verfahren realisiert wird 

a) Einbringen mindestens einer doppelstrangigen Marker- 
protein Ribonukleinsauresequenz oder einer deren 
Expression gewahrleistenden Expressionskassette oder 
Expressionskassetten. 

b) Einbringen mindestens einer Markerprotein antisense-Ribo 
nukleinsauresequenzen oder einer deren Expression gewahr 
leistenden Expressionskassette. 

c) Einbringen mindestens einer Markerprotein antisense-Ribo 
nukleinsauresequenze kombiniert mit einem Ribozym oder 
einer deren Expression gewahrleistenden Expressions- 
kassette oder Expressionskassetten. 

d) Einbringen mindestens einer Markerprotein sense-Ribo- 
nukleinsauresequenzen zur Induktion einer Kosuppression 
oder einer deren Expression gewahrleistenden Expressions 
kassette. 

e) Einbringen mindestens eines DNA-oder Protein-bindenden 
Faktors gegen ein Markerprotein-Gen, — RNA oder -Protein 
oder einer dessen Expression gewahrleistenden 
Expressionskassette . 

f ) Einbringen mindestens einer den Markerprotein RNA-Abbau 
bewirkenden viralen Nukleinsauresequenz oder einer deren 
Expression gewahrleistenden Expressionskassette. 

g) Einbringen mindestens eines Konstruktes zur Erzeugung 
einer Insertion, Deletion, Inversion oder Mutation in 
einem Markerprotein-Gen. 

10. Verfahren nach einem der Anspruche 1 bis 9, wobei die Inakti- 
vierung des Markerprotein-Gens durch das Einbringen einer 
sequenzspezif ischen Rekombinase realisiert wird. 

11. Verfahren nach einem der Anspruche 1 bis 9, wobei die Inakti- 
vierung des Markerprotein-Gens durch das Einbringen eines 
sequenzspezif ischen Enzyms geeignet zur Induktion von DNA- 
Doppelstrangbrtichen realisiert wird. 



BASF Plant Science GmbH 20020471 



PP 53790 DE 




12. Verfahren nach einem der Anspruche 1 bis 11, wobei die 
Inaktivierung des Markerprotein-Gens durch Induktion einer 
intramolekularen oder intermolekularen homologen Rekombi- 
nation realisiert wird. 

5 

13. Verfahren nach Anspruch 12, wobei die homologe Rekombination 
durch Einwirkung eines sequenzspezif ischen Enzyms geeignet 
zur Induktion von DNA-Doppelstrangbruchen gefordert wird. 

10 14. Verfahren nach nach einem der Anspruche 1 bis 13, wobei die 

Inaktivierung des Markerproteins durch Integration einer DNA- 
Sequenz in ein Markerprotein-Gen realisiert wird, umfassend 
nachfolgende Schritte: 



15 i) Einbringen eines Insertionskonstruktes und mindestens 

eines Enzyms geeignet zur Induktion von DNA-Doppel- 
strangbruchen an einer Erkennungssequenz zur gezielten 
Induktion von DNA-Doppelstrangbruchen in oder in der Nahe 
des Markerprotein-Gens, und 

20 

ii) Induktion von DNA-Doppelstrangbruchen an den Erkennungs- 
seguenzen zur gezielten Induktion von DNA-Doppelstrang- 
bruchen in oder in der Nahe des Markerprotein-Gens, und 

25 iii) Insertion des Insertionskonstruktes in das Markerprotein- 

Gen, wobei die Funktionalitat des Markerprotein-Gens und 
- bevorzugt - die Funktionalitat der Erkennungssequenz 
zur gezielten Induktion von DNA-Doppelstrangbruchen 
inaktiviert wird, so dass besagte Erkennungssequenz 

30 nicht mehr durch das Enzym geeignet zur Induktion von 

DNA-Doppelstrangbruchen geschnitten werden kann, und 

iV) Selektion von Pflanzen oder pflanzlichen Zellen, bei 
denen das Insertionskonstrukt in das Markerproteingen 
35 insertiert wurde. 



15. Verfahren nach einem der Anspruche 11, 13 oder 14, wobei 
das sequenzspezifische Enzym geeignet zur Induktion von DNA- 
Doppelstrangbruchen eine Homing-Endonuklease ist. 

40 

16. Verfahren nach einem der Anspruche 1 bis 15, wobei zusammen 
mit der zu insertierenden Nukleinsauresequenz eine Sequenz 
kodierend fur eine Resistenz gegen mindestens ein Toxin, 
Antibiotikum oder Herbizid eingebracht wird, und die 

45 Selektion zusatzlich unter Einsatz des Toxins, Antibiotikums 

oder Herbizids erfolgt. 
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17. Verfahren nach einem der Ansprtiche 1 bis 16, wobei die 
in das Genom der pflanzlichen Zelle oder des pf lanzlichen 
Organismus zu insertierende Nukleinsauresequenz mindestens 
eine Expressionskassette umfasst, wobei besagte Expressions- 
kassette unter Kontrolle eines in pflanzlichen Zellen oder 
pflanzlichen Organismen funktionellen Promotors eine RNA 
und/oder ein Protein exprimieren kann, welche nicht die Ver- 
minderung der Expression, Menge, Aktivitat und/oder Funktion 
eines Markerproteins bewirken. 

18. Verfahren nach einem der Ansprtiche 1 bis 17, wobei die 
pflanzliche Zelle Teil eines pflanzlichen Organismus oder 
eines davon abgeleiteten Gewebes, Teils, Organs, Zellkultur 
oder Vermehrungsmaterials ist. 

15 

19. Doppelstrangiges RNA-Molektil umfassend 

a) einen • sense "-RNA-Strang umfassend mindestens eine Ribo- 
nukleotidsequenz, die im wesentlichen identisch ist zu 

20 mindestens einem Teil des « sense "-RNA-Transkriptes einer 

Nukleinsauresequenz kodierend fur ein Markerprotein, und 

b) einen "antisense" -RNA-Strang, der zu dem RNA-sense-Strang 
unter a) im wesentlichen - bevorzugt vollstandig - 

25 komplementaren ist. 

20. Doppelstrangiges RNA-Molektil nach Anspruch 19, wobei das 
Markerprotein wie in einem der Ansprtiche 2 bis 6 definiert 
ist . 

30 

21. Doppelstrangiges RNA-Molekul nach einem der Ansprtiche 19 
Oder 20, wobei "sense"-RNA-Strang und "anti sense "-RNA-Strang 
kovalent in Form eines invertierten Repeats miteinander ver- 
bunden sind. 

35 

22. Transgene Expressionskassette enthaltend in funktioneller 
Verkntipfung mit einem in pflanzlichen Organismen funktionel- 
len Promotor eine Nukleinsauresequenz kodierend far ein 
doppelstrangiges RNA-Molektil gemaS einem der Ansprtiche 19 

40 bis 21. 



23 



45 



Transgene Expressionskassette enthaltend eine Nukleinsaure- 
sequenz kodierend fur zumindest einen Teil eines Marker- 
proteins, wobei besagte Nukleinsauresequenz mit einem in 
pflanzlichen Organismen f unktionellen Promotor in antisense- 
Orientierung funktionell verkntipft ist. 
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24. Transgene Expressionskassette nach Anspruch 23, wobei das 
Markerprotein wie in einem der Anspruche 2 bis 6 definiert 
ist . 

5 25. Transgener Vektor enthaltend eine transgene Expressions- 
kassette gemaiS einem der Anspruche 22 bis 24. 

26. Transgener pflanzlicher Organismus enthaltend ein doppel- 
strangiges RNA-Molekiil gema£ einem der Anspruche 19 bis 21, 

10 eine transgene Expressionskassette gemafc einem der 

Anspruche 22 bis 24 oder einen transgenen Vektor gema£ 
Anspruch 2 5 . 

27. Transgener pflanzlicher Organismus nach Anspruch 26, aus- 
15 gewahlt aus der Gruppe der Pflanzen bestehend aus Weizen, 

Hafer, Hirse, Gerste, Roggen, Mais, Reis, Buchweizen, 
Sorghum, Triticale, Dinkel, Leinsamen, Zuckerrohr, Raps, 
Kresse, Arabidopsis, Kohlarten, Soja, Alfalfa, Erbse, Bohnen- 
gewachsen, Erdnuss, Kartoffel, Tabak, Tomate, Aubergine, 
Paprika, Sonnenblume, Tagetes, Salat, Calendula, Melone, 
Kurbis und Zucchini. 

28. Gewebe, Organ, Teil, Zelle, Zellkultur oder Vermehrungsgut 
abgeleitet von einem transgenen pflanzlichen Organismus gema£ 

25 einem der Anspruche 2 6 oder 27. 



20 



30 



35 



40 



45 



BASF Plant Science GmbH 



20020471 



PF 53790 DE 



• 



Neue Selektionsverf ahren 
Beschreibung 

5 

Die vorliegende Erfindung betrifft Verfahren zur Herstellung 
trans formierter pf lanzlicher Zellen oder Organismen durch Trans- 
formation einer Population pf lanzlicher Zellen, die mindestens 
ein Markerprotein mit einem fur diese direkt oder indirekt 

10 toxischen Effekt umfasst, mit mindestens einer zu insertierenden 
Nukl e ins aur e s equenz in Kombination mit mindestens einer Ver- 
bindung - bevorzugt einem DNA-Konstrukt - befahigt zur Ver- 
minderung der Expression, Menge, Aktivitat und/oder Funktion des 
Markerproteins, wobei die trans formier ten pflanzlichen Zellen 

15 infolge der Wirkung besagter Verbindung gegenuber nicht-trans- 
formierten Zellen einen Wachs turns vorteil haben. 

Die Einfuhrung genetischen Materials in Zielzellen gelingt meist 
nur in einer sehr begrenzten Anzahl von Zellen einer Population. 

20 Dies macht die Unterscheidung und Isolierung von erfolgreich 
trans formier ten von nicht-trans formier ten Zellen erf orderlich, 
ein Verfahren das als Selektion bezeichnet wird. Traditionell 
erfolgt die Selektion mittels einer sogenannten positiven 
Selektion, wobei die trans formierte Zelle in die Lage versetzt 

25 wird, zu wachsen und zu uberleben, wohingegen die untrans- 
formierte Zelle im Wachstum gehemmt oder abgetotet wird 
(McCormick et al . (1986) Plant Cell Reports 5:81-84). Ublicher- 
weise wird eine derartige positive Selektion durch Gene reali- 
siert, die fur eine Resistenz gegen ein Biozid kodieren (z.B. 

30 ein Herbizid wie Phosphinothricin, Glyphosat oder Bromoxynil , 
einen Metabolismusinhibitor wie 2-Desoxyglucose-6-phosphat 
(WO 98/45456) oder ein Antibiotikum wie Tetracyclin, Ampicillin, 
Kanamycin, G 418, Neomycin, Bleomycin oder Hygromycin) . Derartige 
Gene werden auch als positive Selektionsmarker bezeichnet. Der 

35 positive Selektionsmarker wird gekoppelt (physikalisch oder 

mittels Cotransformation) mit der in das Zellgenom einzufuhrenden 
Nukleinsauresequenz in die Zelle eingebracht. Anschliefcend werden 
die Zellen auf einem Medium unter dem entsprechenden Selektions- 
druck (z.B. in Gegenwart eines entsprechenden Antibiotikums oder 

40 Herbizids) kultiviert, wodurch die trans formier ten Zellen auf- 
grund der erworbenen Resistenz gegen besagten Selektionsdruck 
einen Wachstums-/Uberlebensvorteil haben und so selektioniert 
werden konnen. Beispielhaft als positive Selektionsmarker seien 
genannt : 



45 
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Phosphinothricinacetyltransferasen (PAT) (auch Bialophos®- 
Resistenz; bar) acetylieren die freie Aminogruppe des 
Glutaininsynthaseinhibitors Phosphinothricin (PPT) und 
erreichen damit eine Detoxif izierung (de Block et al . (1987) 
EMBO J 6:2513-2518; Vickers JE et al . (1996) Plant Mol Biol 
Reporter 14:363-368; Thompson CJ et al . (1987) EMBO J 
6:2519-2523) . 



10 




5-Enolpyruvylshikimat~3-phosphatsynthasen (EPSPS) verleihen 
eine Resistenz gegen das unselektive Herbizid Glyphosat® 
(N-(Phosphonomethyl)glycin; Steinrucken HC et al. (1980) 
Biochem Biophys Res Coramun 94:1207-1212; Levin JG und Sprin- 
son DB (1964) J Biol Chem 239:1142-1150; Cole DJ (1985) Mode 
of action of glyphosate; A literature analysis, p. 48-74. In: 
15 Grossbard E und Atkinson D (eds.) The herbicide glyphosate. 

Buttersworths, Boston.). Glyphosat- tolerante EPSPS Varianten 
zur Verwendung als Selektionsmarker sind beschrieben (Pad- 
gette SR et al . (1996). New weed control opportunities: deve- 
lopment of soybeans with a Roundup Ready™ gene. In: Herbicide 
20 Resistant Crops (Duke SO, ed. ) , pp. 53-84. CRC Press, Boca 

Raton, FL; Saroha MK und Malik VS (1998) J Plant Biochemistry 
and Biotechnology 7:65-72; Padgette SR et al.(1995) Crop 
Science 35 (5) : 1451-1461 ; US 5,510,471; US 5,776,760; 
US 5,864,425; US 5,633,435; US 5,627;061; US 5,463,175; 
25 EP-A 0 218 571) . 




Neomycinphosphotransferasen verleihen eine Resistenz gegen 
Aminoglykosid-Antibiotika wie Neomycin, G418, Hygromycin, 
Paromomycin oder Kanamycin, indem sie durch eine Phosphory- 
30 lierungsreaktion deren inhibierende Wirkung reduzieren (Beck 

et al. (1982) Gene 19:327-336). 

2-Desoxyglukose-6-phosphatphosphatasen verleihen eine 
Resistenz gegen 2-Desoxyglukose (EP-A 0 807 836; Randez-Gil 
35 et al. (1995) Yeast 11:1233-1240; Sanz et al . (1994) Yeast 

10:1195-1202) . 



Acetolactatsynthasen verleihen eine Resistenz gegen 
Imidazolinon/Sulfonylharnstoff-Herbizide (z.B. Imazzamox, 
Imazapyr, Imazaquin, Imazethapyr, Amidosulf oron, Azim- 
sulfuron, Chlorimuronethyl , Chi or sulfur on; Sathasivan K 
et al. (1990) Nucleic Acids Res 18(8):2188). 



Daruber hinaus sind Resistenzgene gegen die Antibiotika Hygro- 
45 mycin (Hygromycinphosphotransf erasen) , Chloramphenicol (Chloram- 
phenicolacetyltransferase) , Tetracyclic Streptomycin, Zeocin und 
Ampicillin (fi-Lactamase Gen; Datta N, Richmond MH. (1966) Biochem 
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J 98(l):204-9) beschrieben . 



Gene wie die Isopent enyl trans f erase (ipt) aus Agrobacterium tume- 
faciens ( strain :P022) (Genbank Acc.-No.: AB025109) konnen eben- 
5 falls als Selektionsmarker eingesetzt werden. Das ipt Gen ist 
ein Schlusselenzym cler Cytokin-Biosynthese . Seine Cberexpression 
erleichtert die Regeneration von Pflanzen (z.B. Selektion auf 
Cytokin-freiem Medium) (Ebinuma H et al . (2000) Proc Natl Acad 
Sci USA 94:2117-2121; Ebinuma H et al. (2000) Selection of 

10 Marker-free transgenic plants using the oncogenes (ipt, rol A, B, 
C) of Agrobacterium as selectable markers, In Molecular Biology 
of Woody Plants. Kluwer Academic Publishers). Nachteilig ist hier 
zum einen, dass der Selektionsvorteil auf meist subtilen Unter- 
schieden in der Zellprolif eration beruht, zum anderen die Pflanze 

15 durch die Transformation mit einem Onkogen unerwunschte Eigen- 
schaften (Galltumorbildung) erhalt. 



Verschiedene weitere positive Selektionsmarker sind in 
EP-A 0 601 092 beschrieben. Beispielhaft sind zu nennen: 
fJ-Glucuronidase (in Verbindung mit z.B. Cytokininglucuronid) , 
Mannose-6-phosphat-Isomerase (in Verbindung mit Mannose) , UDP- 
Galaktose-4-Epimerase (in Verbindung mit z.B. Galactose) . 



Negative Selektionsmarker werden zur Selektion von Organismen mit 
erfolgreich deletierten Markersequenzen eingesetzt (Koprek T et 
al. (1999) Plant J 19 (6 ): 719-726) . In Gegenwart eines negativen 
Selektionsmarkers wird die entsprechende Zelle abgetotet oder er- 
f&hrt einen Wachstumsnachteil . Bei der negativen Selektion wird 
beispielsweise durch den in die Pflanze eingebrachten negativen 
Selektionsmarker eine Verbindung, die ansonsten fur die Pflanze 
keine nachteilige Wirkung hat, in eine Verbindung mit nach- 
teiliger (d.h. toxischer) Wirkung umgesetzt. Beispiele fur nega- 
tive Selektionsmarker umfassen: Thymidinkinase (TK) z.B. des Her- 
pes Simplex Virus (Wigler et al . (1977) Cell 11:223), zellulare 
Adeninphosphoribosyltransf erase (APRT) (Wigler et al . (1979) Proc 
Natl Acad Sci USA 76:1373), Hypoxanthinphosphoribosyltransf erase 
(HPRT) (Jolly et al. (1983) Proc Natl Acad Sci USA 80:477), 
Diphtheria Toxin A Fragment (DT-A) , die bakterielle Xanthin- 
Guaninphosphoribosyltransf erase (gpt; Besnard et al . (1987) Mol . 
Cell. Biol. 7:4139; Mzoz and Moolten (1993) Human Gene Therapy 
4:589-595), das codA Genprodukt kodierend ftir eine Cytosinde- 
aminase (Gleave AP et al . (1999) Plant Mol Biol. 40 (2 ): 223-35 ; 
Perera RJ et al . (1993) Plant Mol Biol 23(4): 793-799; Stougaard 
J; (1993) Plant J 3:755-761; EP-A1 595 873), das Cytochrom P450 
Gen (Koprek et al. (1999) Plant J 16:719-726), Gene kodierend fiir 
eine Haloalkandehalogenase (Naested H (1999) Plant J 18:571-576), 
das iaaH Gen (Sundaresan V et al . (1995) Genes & Development 
9:1797-1810) oder das tms2 Gen (Fedoroff NV & Smith DL (1993) 
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Plant J 3: 273-289). Die negativen Selektionsmarker werden meist 
in Kombination mit sogenannten * Prodrugs" oder u Pro-Toxinen" 
eingesetzt, Verbindungen die durch die Aktivitat des Selektions- 
markers in Toxine umgesetzt werden. 

5 

5-Methylthioribose- (MTR) -kinase ist ein Enzym, dessen enzymati- 
sche Aktivitat nicht in Saugern, wohl aber in Pflanzen, Bakterien 
und Protozoen beschrieben ist. Das Enzym kann ein MTR-Analog 
(5- (Trif luoromethyl) thioribose) als sogenanntes Subversives 
10 Substrat" des Methionin-Ausweich-Stof fwechselwegs ("Salvage Path- 
. way") uber ein instabiles Intermediat zu der toxischen Verbindung 
Carbothionyldif luorid umsetzen. 

Besagte Selektionssysteme haben verschiedene Nachteile. Der 

15 eingebrachte Selektionsmarker (z.B. Antibiotikaresistenz) 

hat seine Berechtigung allein wahrend der Transformation und 
Selektion stellt jedoch spater ein in der Regel unnotiges und 
oft auch unerwunschtes Proteinprodukt dar. Dies kann aus Griinden 
der Verbraucherakzeptanz und/oder der Zulassung als Lebens- 

20 und/oder Futtermittel unvorteilhaf t sein. Nachteilig ist in 
diesem Zusammenhang ferner, dass der zur Selektion verwendete 
Selektionsmarker in der Regel genetisch mit der in das Genom zu 
insertierenden Nukleinsauresequenz gekoppelt ist und nicht durch 
Segregation im Rahmen der Vermehrung oder Kreuzung entkoppelt 

25 werden kann. In der Regel ist eine Deletion der Markersequenz 

erforderlich, was zusatzliche Arbeitsschritte erfordert. Daruber- 
hinaus erfordern biotechnologische Arbeiten in zahlreichen Fallen 
eine Mehrfachtransf ormation mit verschiedenen Genkonstrukten. 
Hier ist ftir jeden Transf ormationsschritt ein neuer Selektions- 

30 marker erforderlich, wenn nicht der zuvor verwendete zunachst 
mtihsam deletiert werden soil. Dies erfordert jedoch eine breite 
Palette gut funktionierender Selektionsmarker, die fur die 
meisten pflanzlichen Organismen nicht zur Verfugung stehen. 

35 Es stellte sich folglich die Aufgabe, neue Selektionsverfahren 

zur Selektions transf ormierter pflanzlicher Zellen und Organismen 
bereitzustellen, die moglichst die Nachteile der vorhandenen 
Systeme nicht mehr aufweisen. Diese Aufgabe wird durch die vor- 
liegende Erfindung gelost. 

40 

Ein erster Gegenstand der Erfindung betrifft ein Verfahren zur 
Herstellung transf ormierter pflanzlicher Zellen oder Organismen 
umfassend nachfolgende Schritte: 

45 a) Transformation einer Population pflanzlicher Zellen, wobei 
die Zellen besagter Population mindestens ein Markerprotein 
enthalten, das fur besagte Population direkt oder indirekt 
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5 

einen toxischen Effekt bewirken kann, mit mindestens einer 
zu ins er tier enden Nukleinsauresequenz in Kombination mit 
mindestens einer Verbindung befahigt zur Verminderung der 
Expression, Menge, Aktivitat und/oder Funktion mindestens 
eines Markerproteins , und 



m 




b) Selektion von trans formier ten pf lanzlichen Zellen, die 

ihrem Genom besagte Nukleinsauresequenz aufweisen und die 
infolge der Wirkung besagter Verbindung gegentiber nicht - 
10 transformierten Zellen einen Wachstumsvorteil haben, aus 

besagter Population pflanzlicher Zellen, wobei die Selektion 
unter Bedingungen durchgefuhrt wird, bei denen das Marker- 
protein seinen toxischen Effekt auf die nicht transformierten 
Zellen ausuben kann. 

15 

In einer bevorzugten Aus fuhrungs form ist das Markerprotein 
ein Protein, dass in der Lage ist, eine fur besagte Population 
pflanzlicher Zellen nicht-toxische Substanz X in eine fur besagte 
Population toxische Substanz Y direkt oder indirekt umzusetzen. 
20 Das erfindungsgemaSe Verfahren vjnfasst in diesem Fall bevorzugt 
nachfolgende Schritte: 

a) Transformation der Population pflanzlicher Zellen mit 

mindestens einer zu insertierenden Nukleinsauresequenz in 
25 Kombination mit mindestens einer Verbindung befahigt zur 

Verminderung der Expression, Menge, Aktivitat und/oder 
Funktion mindestens eines Markerproteins, und 



b) 



30 




35 



Behandlung besagter Population pflanzlicher Zellen mit der 
Substanz X in einer Konzentration, die infolge der Umsetzung 
durch das Markerprotein einen fur nicht-transf ormierte Zellen 
toxischen Effekt bedingt, und 

c) Selektion von transformierten pf lanzlichen Zellen, die in 

ihrem Genom besagte insertierte Nukleinsauresequenz aufweisen 
und die infolge der Wirkung besagter Verbindung gegentiber 
nicht-trans formier ten Zellen einen Wachstumsvorteil auf- 
weisen, aus besagter Population pflanzlicher Zellen, wobei 
die Selektion unter Bedingungen durchgefuhrt wird, bei denen 
40 das Markerprotein seinen toxischen Effekt auf die nicht 

transformierten Zellen ausuben kann.. 

Bevorzugt handelt es sich bei der nicht- toxischen Substanz X urn 
^ eine Substanz, die naturlicherweise in pf lanzlichen Zellen oder 
45 Organismen nicht oder nur in Konzentration vorkommt, die im 

wesentlichen keinen toxischen Effekt bewirken konnen. Bevorzugt 
wird die nicht-toxische Substanz X im Rahmen des erfindungs- 
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gemaEen Verfahrens exogen z.B. iiber das Medium oder das wachs- 
tumssubstrat appliziert. 

Der Begriff "Verbindung befahigt zur Verminderung der Expression, 
5 Menge, Aktivitat und/oder Funktion mindestens eines Marker- 
proteins' 7 ist breit zu verstehen und meint allgemein alle Ver- 
bindungen, die direkt oder indirekt, alleine oder in Kooperation 
mit anderen Faktoren eine Verminderung der Proteinmenge, RNA- 
Menge, Genaktivitat , Proteinaktivitat - oder funktion mindestens 

10 eines Markerproteins bewirken. Besagte Verbindungen sind infolge 
auch unter der Bezeichnung "anti-Markerprotein"-Verbindungen 
zusammengefasst. Der Begriff xx anti-Markerprotein"-Verbindung 
schliefct insbesondere - jedoch nicht einschrankend - die im 
Rahmen des erf indungsgemafien Verfahren in den bevorzugten Aus- 

15 fuhrungsf ormen zum Einsatz kommenden Nukleinsauresequenzen, 

•Ribonukleinsauresequenzen, doppelstrangigen Ribonukleinsaure- 
sequenzen, antisense-Ribonukeinsaureseguenzen, Expressions- 
kassetten, Peptide, Proteine oder andere Faktoren ein. 

20 In einer bevorzugten Ausfiihrungsf orm meint "anti-Markerprotein"- 
Verbindung ein DNA-Konstrukt umfassend 

mindestens eine Expressionskassette geeignet zur Expression 
einer Ribonukleinsauresequenz und/oder - gegebenenf alls - 
eines Proteins, wobei besagte Nukleinsauresequenz und/oder 
Protein in der Lage ist, die Expression, Menge, Aktivitat 
und/oder Funktion des Markerproteins zu vermindern, oder 

mindestens eine Sequenz, die eine teilweise oder voll- 
standige Deletion oder Inversion der Sequenz kodierend fur 
besagtes Markerprotein bewirkt und so eine Verminderung 
der Expression, Menge, Aktivitat und/oder Funktion des 
Markerproteins ermoglicht, sowie - gegebenenf alls - weitere 
Funktionselemente, die besagte Deletion oder Inversion 
erleichtern und/oder fordern, oder 

mindestens eine Sequenz, die eine Insertion in die Sequenz 
kodierend fur das besagte Markerprotein bewirkt und so eine 
Verminderung der Expression, Menge, Aktivitat und/oder 
Funktion des Markerproteins ermoglicht, sowie - gegebenen- 
falls - weitere Funktionselemente, die besagte Insertion 
erleichtern und/oder fordern. 

Das erfindungsgemaiSe Verfahren hebt die negativ-selektive 
Wirkung des Markerproteins auf . Insofern wirkt eine "anti- 
Mar kerprot ein "-Verbindungen direkt (z.B. tiber die Inaktivierung 
mittels Insertion in das Gen kodierend fur das Markerprotein) 
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oder indirekt (z.B. mittels der durch die Expressionskassette 
exprimierten Ribonukleinsauresequenz und/oder gegebenenf alls 
des davon translatierte Proteins) als positiver Selektionsmarker . 
Das erfindungsgemaSe Selektionssytem sei infolge als "reverses 
5 Selektionssystem" bezeichnet, da es die negativ-selektive Wirkung 
des Markerproteins "revertiert " . 

Das erf indungsgemafce Verfahren bedeutet eine sprunghaf te Ver- 
breiterung des Repertoirs an positiven Selektionsverf ahren zur 
10 Selektion trans formierter pflanzlicher Zellen. 

Vorteilhaft ist ferner, dass in bestimmten, bevorzugten Aus- 
fuhrungsform (z.B. durch Wirkung einer doppelstrangigen oder 
antisense RNA) der Selektionsef f ekt ohne Expression eines Fremd- 
15 proteins realisiert werden kann (s.u.) . 

Vorteilhaft ist daruber hinaus, dass das zur Selektion indirekt 
verwendete Markerprotein (z.B. der negative Selektionsmarker) 
nicht genetisch mit der in das Genom zu insertierenden Nuklein- 
20 saureseguenz gekoppelt ist. Im Unterschied zu den ansonsten 
ublichen Selektionsverfahren kann das Markerprotein - wenn es 
sich um ein Transgen handelt - durch einfache Segregation im 
Rahmen nachf olgender Vermehrung oder Kreuzung entfemt werden. 

25 "Pflanzliche Zelle" meint im Rahmen der vorliegeiiden Erfindung 
jegliche Art von Zelle, die von einem pflanzlichen Organismus 
abgeleitet oder in diesem vorhanden ist. Der Begriff umfasst 
dabei beispielhaft Protoplasten, Kallus- oder Zellkulturen, 
Mikrosporen, Pollen, Zellen in Form von Geweben wie Blattern, 

30 Meristem, Bliiten, Embryonen, Wurzeln usw. Insbesondere sind all 
solche Zellen und Zellpopulationen umfasst, die sich als Ziel- 
geweben far eine Transformation eignen. 

"Pflanzlicher Organismus" umfasst dabei jeden Organismus, der 
35 zur Photosynthese befahigt ist, sowie die von diesem abgeleitete 
Zellen, Gewebe, Telle oder Vermehrungsgut (wie Samen oder 
Frtichte) . Eingeschlossen sind im Rahmen der Erfindung alle 
Gattungen und Arten heherer und niedrigerer Pflanzen des 
Pf lanzenreiches . Einjahrige, mehrjahrige, monocotyledone und 
40 dicotyledone Pflanzen sowie Gymnospermen sind bevorzugt. 

"Pflanze" im Rahmen der Erfindung meint alle Gattungen und 
Arten hSherer und niedrigerer Pflanzen des Pf lanzenreiches 
Eingeschlossen unter dem Begriff sind die reifen Pflanzen, Saat- 
45 gut, Sprossen und Keimlinge, sowie davon abgeleitete Telle, Ver- 
mehrungsgut (zum Beispiel Knollen, Samen oder Frtichte) , Pflanzen- 
organe, Gewebe, Protoplasten, Kallus und andere Kulturen, zum 
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8 



Beispiel Zellkulturen, sowie alle anderen Arten von Gruppierungen 
von Pf lanzenzellen zu funktionellen oder strukturellen Einheiten. 
Reife Pflanzen meint Pflanzen zu jedem beliebigen Entwicklungs- 
stadium jenseits des Keimlings. Keimling meint eine junge, 
5 unreife Pflanze in einem fruhen En twicklungs stadium. "Pflanze" 
umfasst alle einjahrigen und mehrj&hrige, monokotyledonen und 
dikotyledonen Pflanzen und schlie£t beispielhaft jedoch nicht 
einschrankend solche der Gattungen Cucurbita, Rosa, Vitis, 
Juglans, Fragaria, Lotus, Medicago, Onobrychis, Trifolium, 

10 Trigonella, Vigna, Citrus, Linum, Geranium, Manihot, Daucus, 
Arabidopsis, Brassica, Raphanus, Sinapis, Atropa, Capsicum, 
Datura, Hyoscyamus, Lycopersicon, Nicotiana, Solarium, Petunia, 
Digitalis, Majorana, Cichorium, Helianthus, Lactuca, Bromus, 
Asparagus, Antirrhinum, Heterocallis , Nemesis, Pelargonium, 

15 Panieum, Pennisetum, Ranunculus, Senecio, Salpiglossis, Cucumis, 
Browaalia, Glycine, Pisum, Phaseolus, Lolium, Oryza, Zea, Avena, 
Hordeum, Secale, Triticum, Sorghum, Picea und Populus ein. 

Bevorzugt sind Pflanzen nachf olgender Pf lanzenf amilien: Amaranth- 
20 aceae, Asteraceae, Brassicaceae, Carophyllaceae, Chenopodiaceae, 
Compositae, Cruciferae, Cucurbitaceae, Labiatae, Leguminosae, 
Papilionoideae, Liliaceae, Linaceae, Malvaceae, Rosaceae, 
Rubiaceae , Saxi f ragaceae , Scr ophular iaceae , Solanacea , 
Sterculiaceae, Tetragoniacea, Theaceae, Umbellif erae. 

25 

Bevorzugte monokotyle Pflanzen sind insbesondere ausgewahlt aus 
den monokotylen Kulturpf lanzen, wie zum Beispiel der Familie der 
Gramineae wie Alfalfa, Reis, Mais, Weizen oder andere Getreide- 
arten wie Gerste, Hirse, Roggen, Triticale oder Hafer sowie dem 
30 Zuckerrohr sowie alien Arten von Grasern. 

Bevorzugte dikotyle Pflanzen sind insbesondere ausgewahlt aus den 
dikotylen Kulturpf lanzen, wie zum Beispiel 

35 - Asteraceae wie Sonnenblume, Tagetes oder Calendula und andere 



Compositae, besonders die Gattung Lactuca, ganz besonders die 
Art sativa (Salat) und andere mehr, 



- Cruciferae, besonders die Gattung Brassica, ganz besonders 
die Arten napus (Raps) , campestris (Rube) , oleracea cv Tastie 
(Kohl) , oleracea cv Snowball Y (Blumenkohl) und oleracea cv 
Emperor (Broccoli) und weitere Kohlarten; und der Gattung 
Arabidopsis, ganz besonders die Art thaliana sowie Kresse 
oder Canola und andere mehr, 



mehr, 



40 
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Cucurbitaceae wie Melone, Ktirbis oder Zucchini und andere mehr, 

Leguminosae besonders die Gattung Glycine, ganz besonders die 
Art max (Sojabohne) sowie Alfalfa, Erbse, Bohnengewachsen oder 
Erdmiss und andere mehr 

Rubiaceae, bevorzugt der Unterklasse Lamiidae wie beispiels- 
weise Coffea arabica oder Coffea liberica (Kaf f estrauch) und 
andere mehr, 




- Solanaceae besonders die Gattung Lycopersicon, ganz besonders 
die Art esculentum (Tomate) , die Gattung Solanum, ganz beson- 
ders die Art tuberosum (Kartoffel) und melongena (Aubergine) 
und die Gattung Capsicum, ganz besonders die Art annum (Pfef- 

15 fer) sowie Tabak und andere mehr, 

- Sterculiaceae, bevorzugt der Unterklasse Dilleniidae wie bei- 
spielsweise Theobroma cacao (Kakaostrauch) und andere mehr, 

20 - Theaceae, bevorzugt der Unterklasse Dilleniidae wie beispiels- 
weise Camellia sinensis oder Thea sinensis (Teestrauch) und 
andere mehr, 

- Umbelliferae, besonders die Gattung Daucus (ganz besonders 
25 die Art carota (Karrotte) ) und Apium (ganz besonders die Art 

graveolens dulce (Sellerie) ) und andere mehr; 

sowie Lein, Baumwolle, Hanf, Flachs, Gurke, Spinat, Mohre, 
Zuckerrxibe und den verschiedenen Baum-, Nuss- und Weinarten, 
30 insbesondere Banane und Kiwi. 

Pflanzliche Organismen im Sinne der Erfindung sind weiterhin 
weitere photosynthetisch aktive befahigte Organismen, wie zum 
Beispiel Algen, Cyanobakterien sowie Moose. Bevorzugte Algen sind 
35 Grtinalgen, wie beispielsweise Algen der Gattung Haematococcus , 
Phaedactylum tricornatum, Volvox oder Dunaliella. Insbesondere 
bevorzugt ist Synechocystis . 



Besonders bevorzugt ist die Gruppe der Pflanzen bestehend aus 
Weizen, Hafer, Hirse, Gerste, Roggen, Mais, Reis, Buchweizen, 
Sorghum, Triticale, Dinkel, Leinsamen, Zuckerrohr, Raps, Kress 
Arabidopsis, Kohlarten, Soja, Alfalfa, Erbse, Bohnengewachsen, 
Erdnuss, Kartoffel, Tabak, Tomate, Aubergine, Paprika, Sonnen- 
blume, Tagetes, Salat, Calendula, Melone, Kurbis und Zucchini. 
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20 



10 



Am meisten bevorzugt sind 



a) 



10 



b) 



c) 



d) 



Pflanzen, die zur Olproduktion geeignet sind, wie beispiels- 
weise Raps, Sonnenblume, Sesam, Farberdistel (Carthamus 
tinctorius), Olbaum, Soja, Mais, Erdnuss, Rizinus, Olpalme, 
Weizen, Kakaostrauch oder verschiedene Nussarten wie bei- 
spielsweise Walnuss, Kokosnuss oder Mandel . Unter diesen 
wieder besonders bevorzugt sind dikotyledonen Pflanzen, ins- 
besondere Raps, Soja und Sonnenblume . 

Pflanzen, die der Starkeproduktion dienen, wie beispielsweise 
Mais, Weizen oder Kartof f el . 

Pflanzen, die als Nahrungs- und/oder Futtermittel und/oder 
Nutzpflanze genutzt werden und bei denen eine Resistenz gg. 
Pathogene vor-teilhaft ware, wie beispielsweise Gerste, 
Roggen, Reis, Kartof f el, Baumwolle, .Flachs, Lein. 

Pflanzen, die zur Produktion von Feinchemikalien wie bei- 
spielsweise Vitaminen und/oder Carotinoiden dienen konnen, 
wie beispielsweise Raps. 




''Population pflanzlicher Zellen" meint jegliche Gruppe von 
pflanzlichen Zellen die im Rahmen der vorliegenden Erfindung 
25 einer Transformation unterworfen werden kann und von der nach dem 
erf indungsgemafcen Verfahren transf ormierte transgene pflanzliche 
Zellen erhalten und isoliert werden konnen. Besagte Population 
kann dabei beispielsweise auch ein pflanzliches Gewebe, Organ 
oder eine Zellkultur usw. sein. 

30 

"Genom" meint die Gesamtheit der Erbinf ormation einer pflanz- 
lichen Zelle und umfasst sowohl die genetische Information des 
Zellkerns als auch die der Plastiden (z.B. Chloroplasten) und 
Mitochondrien. Bevorzugt meint Genom jedoch die genetische 
35 Information des Zellkerns (beispielsweise der nukleSren Chromo- 
somen) . 



"Selektion" meint das Identif izieren und/oder Isolieren von 
erfolgreich transf ormieren pflanzlichen Zellen aus einer Popu- 

40 lation nicht-transf ormierter Zellen unter Einsatz des erfindungs- 
gemafcen Verf ahrens . Dabei ist es nicht zwingend erf orderlich, 
dass die Selektion unmittelbar nach der Transformation direkt 
mit den transf ormierten Zellen erfolgt. Es ist auch moglich, die 
Selektion erst zu einem spateren Zeitpunkt, ja sogar bei einer 

45 spateren Generation der aus der Transformation resultierenden 
pflanzlichen Organismen (bzw. von diesen abgeleiteten Zellen, 
Geweben, Organen oder Vermehrungsgut) vorzunehmen. So konnen' 
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beispielsweise Arabidopsispf lanzen direkt mit z.B. der Vakuum- 
infiltrationsmethode trans formiert werden (Clough S & Bent A 
(1998) Plant J 16(6) : 735-43/ Bechtold N et al . (1993) CR Acad 
Sci Paris 1144(2) :204-212) und ergeben infolge transgene Samen, 
welche anschlieSend der Selektion ausgesetzt werden konnen. 



'in 




Die Tatsache, dass die zu insertierende Nukleinsauresequenz ^ 
Kombination mit" der w anti-Markerprotein"-Verbindung (beispiels- 
weise einem DNA-Konstrukt ) transf ormiert wird, ist breit zu ver- 
10 stehen und meint, dass mindestens eine zu insertierende Nuklein- 
sauresequenz und mindestens eine "anti-Markerprotein"-Verbindung 
miteinander funktionell gekoppelt sind, so dass das Vorliegen der 
w anti-Markerprotein"-Verbindung in der pflanzlichen Zelle - und 
des damit verbundenen Selektionsvorteils - das parallele Vor- 
15 liegen der insertierten Nukleinsauresequenz als wahrscheinlich 
anzeigt. Die zu insertierende Nukleinsauresequenz und die "anti- 
Markerprotein"-Verbindung (z.B. ein DNA-Konstrukt) konnen dabei 
bevorzugt, jedoch nicht zwingend, Teil eines einzigen Nuklein- 
saurekonstruktes (z.B. eines Transf ormationskonstruktes oder 
20 Trans format! onsvektors) sein, aD^o physikalisch-chemisch durch 
eine kovalente Bindung gekoppelt vorliegen. Sie konnen jedoch 
auch getrennt, beispielsweise im Rahmen einer Co-Transformation, 
gemeinsam eingeftthrt werden und auch so ihre Funktion im Rahmen' 
des erfindungsgemalSen Verfahrens wahrnehmen. 



25 




"Nicht toxische Substanz X" meint allgemein Substanzen, die im 
Vergleich zu ihrem' Umsetzungsprodukt Y - unter ansonsten gleichen 
Bedingungen - eine verminderte, bevorzugt eine im wesentlichen 
fehlende biologische Aktivitat - bevorzugt Toxizitat - aufweisen. 

30 Dabei ist die Toxizitat der Substanz Y mindestens doppelt so hoch 
wie die der Substanz X, bevorzugt mindestens funffach so hoch, 
besonders bevorzugt mindestens zehnfach so hoch, ganz besonders 
bevorzugt mindestens zwanzigfach so hoch, am meistens bevorzugt 
mindestens einhundertf ach so hoch. "Gleiche Bedingungen" meint 

35 dabei, dass alle Bedingungen abgesehen von den unterschiedlichen 
Substanzen X bzw. Y gleich gehalten werden. Es werden demnach 
gleiche molare Konzentrationen von X bzw. Y, bei gleichem Medium, 
Temperatur, Organismenart und -dichte etc. eingesetzt. Die 
Umwandlungen der Substanz X in die Substanz Y kann auf ver- 

40 schiedene Weise z.B. durch Hydrolyse, Deaminierung, Verseifung, 
Dephosphorylierung, Phosphorylierung, Oxidation oder eine andere 
Art der Aktivierung, Metabolisierung oder Umsetzung realisiert 
werden. Beispielhaft - jedoch nicht einschrankend - kann die 
Substanz X die inaktive Vorstufe oder Derivat eines Pflanzen- 

45 wachstumsregulators oder Herbizids sein. 
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"Toxizitat" Oder "toxischer Effekt" meint einen messbaren, 
negativen Einfluss auf die Physiologie der Pflanze oder der 
pflanzlichen Zelle und kann dabei Symptome wie beispielsweise 
- jedoch nicht einschrankend - ein vermindertes oder gestortes 
5 Wachstum, eine verminderte oder gestorte Photosyntheserate, eine 
verminderte oder gestSrte Zellteilung, eine verminderte oder 
gestorte Regeneration einer vollstandigen Pflanze aus Zellkultur 
oder Kallus usw. umfassen. 

10 Die mittels des erf indungsgemassen Verfahrens erfolgreich trans- 
formierten pflanzlichen Zellen weisen - anders ausgedruckt - 
gegeniiber den nicht-transf ormierten Zellen der gleichen Ausgangs- 
population einen Wachstumsvorteil oder Selektionsvorteil unter 
Einwirkung der Substanz »X» auf. Wachs turns- oder Selektionsvor- 

15 teil ist dabei breit zu verstehen und meint beispielsweise die 
Tatsache, dass besagte transf ormierte pflanzliche Zellen in der 
Lage sind, Schosslinge auszubilden und/oder zu vollstandigen 
Pflanzen regenerierbar sind, wohingegen die nicht-transf ormierten 
Zellen dies nicht oder nur mit deutlicher Verzogerung realisieren 

20 kQnnen. 




Der Begriff des "Markerproteins" ist breit zu verstehen und meint 
allgemein all solche Proteine, die befahigt sind, 

25 i) per se einen toxischen Effekt auf die Pflanze oder pflanz- 
liche Zelle auszuuben, oder 

ii) eine nicht toxische Substanz X in eine fur die Pflanze oder 
pflanzliche Zelle toxische Substanz Y direkt oder indirekt 
30 umzusetzen. 

Dabei kann es sich bei dem Markerprotein urn ein pf lanzeneigenes , 
endogenes Gen oder aber auch urn ein Transgen aus einem anderen 
Orgamsmus handeln. Bevorzugt hat das Markerprotein selber keine 
35 essentielle Funktion fur den das Markerprotein umfassenden 

Organismus. ttbt das Markerprotein per se einen toxischen Effekt 
aus, so wird es bevorzugt nicht konstitutiv sondern beispiels- 
weise unter einem induzierbaren Promotor exprimiert. 

40 Bevorzugt setzt jedoch das Markerprotein eine nicht toxische 
Substanz X in eine fur die Pflanze oder pflanzliche Zelle 
toxische Substanz Y direkt oder indirekt urn. Insbesondere 
bevorzugt sind als Markerprotein die sogenannten "negativen 
Selektionsmarker", wie sie beispielsweise im Rahmen von gezielten 

45 Deletionen aus dem Genom eingesetzt werden. 
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Beispielhaft jedoch nicht einschrankend sind fur Markerproteine 



zu nermen : 



(a) Cytosindeaminasen (CodA oder CDase) , wobei bevorzugt 

Substanzen wie 5-Fluorocytosin (5-FC) als nicht toxische 
Substanz X eingesetzt werden. Cytosindeaminasen katalysieren 
die Deaminierung von Cytosin zu Uracil (Kilstrup M et al . 
(1989) J Bacterid 171:2124-2127; Anderson L et al . (1989) 
Arch Microbiol 152:115-118). Bakterien und Pilze, die CDase- 
Aktivitat aufweisen, konvertieren 5-FC zu dem toxischen Meta- 
boliten ("Y") 5-Fluorouracil (5-FU) (Polak A & Scholer HJ 
(1975) Chemotherapy (Basel) 21:113-130). 5-FC selbst ist von 
geringer Toxizitat (Bennett JE, in Goodman and Oilman: the 
Pharmacological Basis of Therapeutics. 8th ed. , eds . Oilman 
AG et al. (Pergamon Press, New York) pp. 1165-1181). 5-FU 
jedoch hat einen stark zytotoxischen Effekt da es infolge zu 
Fluoro-UTP (FUTP) und Fluoro-dUMP (FdUMP) metabolisiert wird 
und so die RNA- und DNA-Synthese inhibiert (Calabrisi P & 
Chabner BA in Goodman and Gilman: the Pharmacological Basis 
of Therapeutics. 8th ed. , eds. Gilman AG et al . (Pergamon 
Press, New York) pp. 1209-1263); Damon LE et al . (1989) 
Pharmac Ther 43:155-189). 

Zellen hoherer Pflanzen und Saugerzellen haben keine signi- 
fikante CDase-Aktivitat und kSnnen 5-FC nicht deaminieren 
(Polak A et al. (1976) Chemotherapy 22:137-153; Koechlin BA 
et al. (1966) Biochemical Pharmacology 15:434-446). Insofern 
wird im Rahmen des erf indungsgemafcen Verfahrens die CDase als 
Transgen (z.B. in Form einer transgenen Expressionskassette) 
in pflanzliche Organismen eingebracht. Entsprechende trans- 
gene pflanzliche Zellen oder Organismen werden dann als 
Masterpflanzen als Ausgangsmaterial eingesetzt. Entsprechende 
CDase Sequenzen, transgene pflanzliche Organismen und die 
Durchfuhrung negativer Selektionsverf ahren unter Einsatz 
von z.B. 5-FC als nicht toxische Substanz X sind dem Fach- 
mann bekannt (WO 93/01281; US 5,358,866; Gleave AP et al . 
(1999) Plant Mol Biol 40 (2 ) :223-35 ; Perera RJ et al . (1993) 
Plant Mol Biol 23 (4) : 793-799 ; Stougaard J (1993) Plant J 
3:755-761); EP-A1 595 837; Mullen CA et al . (1992) Proc Natl 
Acad Sci USA 89(l):33-37; Kobayashi T et al . (1995) Jpn J 
Genet 70 (3 ): 409-422 ; Schlaman HRM & Hooykaas PFF (1997) Plant 
J 11:1377-1385; Xiaohui Wang H et al . (2001) Gene 272(1-2): 
249-255; Koprek T et al . (1999) Plant J 19 (6) : 719-726; Gleave 
AP et al. (1999) Plant Mol Biol 40 (2 ): 223-235 ; Gallego ME 
(1999) Plant Mol Biol 39(l):83-93; Salomon S & Puchta H 
(1998) EMBO J 17(20) :6086-6095; Thykjaer T et al . (1997) 
Plant Mol Biol 35 (4) : 523-530; Serine G (1997) Plant J 
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12(3) :697-701; Risseeuw E (1997) Plant J 11 (4) : 717-728 ; Blanc 
V et al. (1996) Biochimie 78 (6) : 511-517 ; Corneille S et al . 
(2001) Plant J 27:171-178). Cytosindeaminasen und die daftir 
kodierenden Gene konnen aus einer Vielzahl von Organismen, 
5 bevorzugt Mikroorganismen, wie beispielsweise den Pilzen 

Cryptococcus neoformans, Candida albicans, Torulopsis 
glabrata, Sporothrix schenckii, Aspergillus, Cladosporium 
und Phialophora (JE Bennett, Chapter 50: Antifungal Agents, 
in Goodman and Oilman's the Pharmacological Basis of Thera- 
10 peutics 8th ed., A.G. Gilman, ed. , Pergamon Press, New York, 

1990) sowie den bakterien E.coli und Salmonella typhimurium 
(Andersen L et al . (1989) Arch Microbiol 152:115-118) 
erhalten werden. 

15 Auf die im Rahmen der genannten Publikationen offenbarten 

Sequenzen, Materialien und Verfahren wird hiermit aus- 
drticklich Bezug genommen. 

Insbesondere bevorzugt sind Sequenzen entsprechend der 
20 GenBank Acc.-No: S56903, sowie die in EP-A1 595 873 

beschriebenen modif izierten codA Sequenzen, die eine 
Expression in Eukaryoten ermoglichen. Bevorzugt sind dabei 
Nukleinsauresequenzen, die fur Polypeptide gemafc SEQ ID NO: 2 
Oder - bevorzugt - 4 kodieren, insbesondere die Sequenzen 
25 gemafi SEQ ID NO: 1 oder - bevorzugt - 3. 

(b) Cytochrom P-450 Enzyme, insbesondere das bakterielle Cyto- 
chrom P-450 SU1 Genprodukt (CYP105A1) aus Streptomyces 
griseolus (Stamm ATCC 11796) , wobei bevorzugt Substanzen wie 

30 das Pro-Sulfonylharnstoffherbizid R7402 (2-Methylethyl-2-3- 

dihydro-N- [ (4, 6-dimethoxypyrimidin-2-yl) aminocarbonyl ] -1, 2- 
benzoisothiazol-7-sulfonamid-l,l-dioxid) als nicht toxische 
Substanz X eingesetzt werden. Entsprechende Sequenzen und die 
Durchfuhrung negativer Selektionsverfahren unter Einsatz von 

35 z.B. R7402 als nicht toxische Substanz X sind dem Fachmann 

bekannt (O'Keefe DP et al . (1994) Plant Physiol 105:473-482- 
Tissier AF et al . (1999) Plant Cell 11:1841-1852; Koprek T 
et al. (1999) Plant J 19 (6) :719-726; O'Keefe DP (1991) Bio- 
chemistry 30(2) :447-55) . Auf die im Rahmen der genannten 

40 Publikationen offenbarten Sequenzen, Materialien und Ver- 

fahren wird hiermit ausdrucklich Bezug genommen. 

Insbesondere bevorzugt sind Sequenzen entsprechend der 
GenBank Acc.-No: M32238. Bevorzugt sind femer Nuklein- 
45 sauresequenzen, die fur das Polypeptid gemafi SEQ ID NO: 6 

kodieren, insbesondere die Sequenz gemaS SEQ ID NO: 5. 
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(c) Indoles sigsaurehydrolasen wie beispielsweise das tms2 

Genprodukt aus Agrobacterium tumefaciens, wobei bevorzugt 
Substanzen wie Auxinamidverbindungen oder Naphthalacetamid 

(NAM) als nicht toxische Svibstanz X eingesetzt werden (wobei 
NAM zu NaphthalessigsMure, einer phytotoxischen Svibstanz, um- 
gesetzt wird) . Entsprechende Sequenzen und die Durchfuhrung 
negativer Selektionsverf ahren unter Einsatz von z.B. NAM als 
nicht toxische Substanz X sind dem Fachmann bekannt (Fedoroff 
NV & Smith DL (1993) Plant J 3:273-289; Upadhyaya NM et al. 

(2000) Plant Mol Biol Rep 18:227-223; Depicker AG et al . 

(1988) Plant Cell rep 104:1067-1071; Karlin-Neumannn GA 
et al. (1991) Plant Cell 3:573-582; Sundaresan V etal . (1995) 
Gene Develop 9:1797-1810; Cecchini E et al . (1998) Mutat 
Res 401(1-2) :199-206; Zubko E et al . (2000) Nat Biotechnol 
18:442-445). Auf die im Rahmen der genannten Publikationen 
offenbarten Sequenzen, Materialien und Verfahren wird hiermit 
ausdrticklich Bezug genommen. 



Insbesondere bevorzugt sind Sequenzen entsprechend den Gen- 
20 Bank Acc.-No: NC_003308 (Protein_id="NP_536128 . 1) , AE009419, 

AB016260 (Protein_id="BAA87807.1) undNC002147. Bevorzugt 
sind ferner NukleinsSuresequenzen, die fur Polypeptide gemaJS 
SEQ ID NO: 8 oder 10 kodieren, insbesondere die Sequenzen 
gemaS SEQ ID NO: 7 oder 9. 



25 



(d) 



Haloalkandehalogenasen (dhlA Genprodukt) z.B. aus Xantho- 
bacter autotropicus GJ10. Die Dehalogenase hydrolisiert 
Dihaloalkane wie 1 , 2-Dichloroethan (DCE) zu halogenierten 
Alkoholen und anorganischen Haliden (Naested H et al . (1999) 
30 Plant J 18(5)571-576; Janssen DB et al . (1994) Annu Rev 

Microbiol 48: 163-191; Janssen DB (1989) J Bacterid 
171 (12) : 6791-9) . Auf die im Rahmen der genannten Publi- 
kationen offenbarten Sequenzen, Materialien und Verfahren 
wird hiermit ausdrticklich Bezug genommen. 



35 



40 



Insbesondere bevorzugt sind Sequenzen entsprechend der 
GenBank Acc.-No: M26950. Bevorzugt sind ferner Nuklein- 
sauresequenzen, die fur das Polypeptid gemaS SEQ ID NO: 12 
kodieren, insbesondere die Sequenz gemaS SEQ ID NO: 11. 



(e) Thymidinkinasen (TK) , insbesondere virale TKs aus Viren wie 
Herpes Simplex Virus, SV40, Cytomegalovirus, Varicella-zoster 
Virus, insbesondere die TK des Typ 1 Herpes Simplex Virus (TK 
HSV-1) , wobei bevorzugt Substanzen wie Acyclovir, Ganciclovir 
45 oder 1 , 2-Deoxy-2-f luoro-(3-D-arabinofuranosil-5-iodouracil 

(FIAU) als nicht toxische Substanz X eingesetzt werden. 
Entsprechende Sequenzen und die Durchftihrung negativer 
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Selektionsverfahren unter Einsatz von z.B. Acyclovir, 
Ganciclovir oder FIAU als nicht toxische Substanz X sind dem 
Fachmann bekannt (Czako M & Marton L (1994) Plant Physiol 
104:1067-1071; Wigler M et al. (1977) Cell 11 (1) : 223-232 ; 
5 McKnight SL et al. (1980) Nucl Acids Res 8 (24) : 5949-5964 

McKnight SL et al . (1980) Nucl Acids Res 8 (24) : 5931-5948 
Preston et al . (1981) J Virol 38 (2 ): 593-605 ; Wagner et al . 
(1981) Proc Natl Acad Sci USA 78 (3 ): 1441-1445 ; St. Clair 
et al.(1987) Antimicrob Agents Chemother 31 (6) : 844-849) . 
10 Auf die im Rahmen der genannten Publikationen offenbarten 

Sequenzen, Materialien und Verfahren wird hiermit aus- 
drQcklich Bezug genommen. 

Insbesondere bevorzugt sind Sequenzen entsprechend den 
15 GenBank Acc.-No: J02224, V00470 und V00467. Bevorzugt sind 

ferner Nukleinsauresequenzen, die fur Polypeptide gemaS 
SEQ ID NO: 14 oder 16 kodieren, insbesondere die Sequenzen 
gemaJS SEQ ID NO: 13 oder 15. 

20 (f) Guaninphosphoribosyltransferasen, Hypoxanthinphosphoribosyl- 
transferasen oder Xanthinguaninphosphoribosyl trans ferasen, 
wobei bevorzugt Substanzen wie 6-Thioxanthin oder Allopurinol 
als nicht toxische Substanz X eingesetzt werden. Bevorzugt 
sind Guaninphosphoribosyl trans ferasen (gpt) z.B. aus E. Coli 

25 (Besnard et al . (1987) Mol Cell Biol 7:4139; Mzoz and Moolten 

(1993) Human Gene Therapy 4:589-595; Ono et al . (1997) Hum 
Gene Ther 8 (17) : 2043-55) , Hypoxanthinphosphoribosyl trans - 
ferasen (HPRT; Jolly et al . (1983) Proc Natl Acad Sci USA 
80:477; Fonwick "The HGPRT System", pp. 333-373, M. Gottes- 

30 man (ed.), Molecular Cell Genetics, John Wiley and Sons, 

New York, 1985) , Xanthinguaninphosphoribosyl transferasen 
z.B. aus Toxoplasma gondii (Knoll LJ et al.(1998) Mol Cell 
Biol 18(2) :807-814; Donald RG et al . (1996) J Biol Chem 
271(24) :14010-14019) . Auf die im Rahmen der genannten 

35 Publikationen offenbarten Sequenzen, Materialien und Ver- 

fahren wird hiermit ausdrucklich Bezug genommen. 

Insbesondere bevorzugt sind Sequenzen entsprechend den 
GenBank Acc.-No: U10247 (Toxoplasma gondii HXGPRT) , M13422 
40 (E. coli gpt) und X00221 (E. coli gpt) . Bevorzugt sind 

ferner Nukleinsauresequenzen, die fur Polypeptide gemaS 
SEQ ID NO: 18, 2 0 oder 22 kodieren, insbesondere die 
Sequenzen gemafi SEQ ID NO: 17, 19 oder 21. 

45 (g) Purinnukleosidphosphorylasen (PNP; DeoD Genprodukt) z.B. 

aus E. coli, wobei bevorzugt Substanzen wie 6-Methylpurin- 
deoxyribonukleosid als nicht toxische Substanz X eingesetzt 



BASF Plant Science GmbH 20020471 



PP 53790 DE 



10 



17 

werden. Entsprechende Sequenzen und die Durchfuhrung nega- 
tiver Selektionsverfahren unter Einsatz von z.B. 6-Methyl- 
purindeoxyribonukleosid als nicht toxische Substanz X sind 
dem Fachmann bekannt (Sorscher EJ et al . (1994) Gene Therapy 
1:233-238). Auf die im Rahmen der genannten Publikationen 
offenbarten Sequenzen, Materialien und Verfahren wird hiermit 
ausdrttcklich Bezug genommen. 

Insbesondere bevorzugt sind Sequenzen entsprechend der 
GenBank Acc.-No: M60917. Bevorzugt sind f erner Nuklein- 
sauresequenzen, die fur das Polypeptid gemaS SEQ ID NO: 24 
kodieren, insbesondere die Sequenz gemaJS SEQ ID NO: 23. 



h) 

15 



Phosphonatmonoesterhydrolasen, welche inaktive Esterderivate 
des Herbizides Glyphosat (z.B. Glycerylglyphosat) zu der 
aktiven Form des Herbizids umsetzen. Entsprechende Sequenzen 
und die Durchfuhrung negativer Selektionsverfahren unter Ein- 
satz von z.B. Glycerylglyphosat sind dem Fachmann bekannt 
(US 5,254,801; Dotson SB et al . (1996) Plant J 10 (2 ): 383-392 ; 
20 Dotson SB et al . (1996) J Biol Chem 271(42): 25754-25761). 

Auf die im Rahmen der genannten Publikationen offenbarten 
Sequenzen, Materialien und Verfahren wird hiermit ausdriick- 
lich Bezug genommen. 



25 



Insbesondere bevorzugt sind Sequenzen entsprechend der 
GenBank Acc.-No: U44852 . Bevorzugt sind f erner Nuklein- 
sauresequenzen, die fur das Polypeptid gemaJS SEQ ID NO: 26 
kodieren, insbesondere die Sequenz gemSJS SEQ ID NO: 25. 

30 (i) Aux-1 und - bevorzugt - Aux-2 Genprodukte z.B. der Ti- 

Plasmide von Agrobacterium Stammen wie A.rhizogenes oder 
A.tumefaciens (Beclin C et al . (1993) Transgenics Res 
2:4855); Gaudin V, Jouanin L. (1995) Plant Mol Biol 
28(1) :123-36. 

35 

Die Aktivitat der beiden Enzyme bedingt die Produktion von 
Indolacetamid (IAA) in der pflanzlichen Zelle. Aux-1 kodiert 
fiir eine Indolacetamidsynthase (IAMS) und setzt Tryptophan zu 
Indolacetamid urn (VanOnckelen et al . (1986) FEBS Lett. 198: 

10 357-3 60) . Aux-2 kodiert fur das Enzym Indolacetamidhydrolase 

(IAMH) und setzt Indolacetamid, eine Substanz ohne Phyto- 
hormonaktivitat, zu dem aktiven Auxin Indolessigsaure urn 
(Inze D et al. (1984) Mol Gen Genet 194:265-274; Tomashow 
et al. (1984) Proc Natl Acad Sci USA 81:5071-5075; Schroder 

15 et al. (1984) Eur J Biochem 138:387-391). Das Enzym IAMH kann 

ferner einer Reihe von Indolamid-Substraten wie beispiels- 
weise Naphthalacetamid hydrolisieren, wobei letz teres in den 
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(j) 



25 



30 
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Pflanzenwachstumsregulator Naphthalessigsaure (NAA) umgesetzt 
wird. Die Verwendung des IAMH Gens als negativer Selektions- 
marker ist beispielsweise in US 5,180,873 beschrieben. 
Entsprechende Enzyme sind auch in A. rhizogenes, A. vitis 
(Canaday J et al. (1992) Mol Gen Genet 235:292-303) and 
Pseudomonas savastanoi (Yamada et al . (1985) Proc Natl 
Acad Sci USA 82:6522-6526) beschrieben. Der Einsatz als 
negativer Selektionsmarker zum Abtoten bestimmter Zell- 
gewebe (z.B. Pollen; US 5,426,041) oder transgener Pflanzen 
(US 5,180,873) ist beschrieben. Entsprechende Sequenzen und 
die DurchfOhrung negativer Selektionsverf ahren unter Einsatz 
von z.B. Naphthalacetamid sind dem Fachmann bekannt (s.o.) . 
Auf die im Rahmen der genannten Publikationen offenbarten 
Seguenzen, Materialien und Verfahren wird hiermit aus- 
drticklich Bezug genommen. 

Insbesondere bevorzugt sind Seguenzen entsprechend den Gen- 
Bank Acc.-No: M61151, AF039169 und AB025110. Bevorzugt sind 
ferner Nukleinsaureseguenzen, die fur Polypeptide gemaS 
SEQ ID NO: 28, 30, 32, 34 oder 3 6 kodieren, insbesondere 
die Seguenzen gemafi SEQ ID NO: 27, 29, 31, 33 oder 35. 

Adeninphosphoribosyltransferasen (APRT) , wobei bevorzugt 
Substanzen wie 4-Aminopyrazolopyrimidin als nicht toxische 
Substanz X eingesetzt werden. Entsprechende Seguenzen und die 
DurchfOhrung negativer Selektionsverf ahren unter Einsatz sind 
dem Fachmann bekannt (Wigler M et al . (1979) Proc Natl Acad 
Sci USA 76(3) :1373-6; Taylor et al. "The APRT System", pp., 
311-332, M. Gottesman (ed. ) , Molecular Cell Genetics, John 
Wiley and Sons, New York, 1985) . 



k) Methoxinindehydrogenasen, wobei bevorzugt Substanzen wie 

2-Amino-4-methoxy-butansaure (Methoxinin) als nicht toxische 
Substanz X eingesetzt werden, welches zum toxischen Methoxy- 
35 vinylglycin umgesetzt wird (Margraff R et al . (1980) Experi- 

mentia 36 : 846) . 



1) 



40 



Rhizobitoxinsynthasen, wobei bevorzugt Substanzen wie 
2-Amino-4-methoxy-butansaure (Methoxinin) als nicht toxische 
Substanz X eingesetzt werden, welches zum toxischen 2-Amino- 
4- [2-amino-3-hydroxypropyl] -trans-3-butansaure (Rhiz obi toxin) 
umgesetzt wird (Owens LD et al . (1973) Weed Science 
21:63-66) , 



45 m) 5-Methylthioribose (MTR) kinasen, wobei bevorzugt Substanzen 
wie 5-(Trifluoromethyl) thioribose (MTR-Analog, "subversives 
Substrat") als nicht toxische Substanz X eingesetzt wird, 
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welches tiber ein instabiles Intermediat zu der toxischen 
Substanz (Y) Carbothionyldif luorid umgesetzt wird. Die 
MTR-Kinase ist ein Schlusselenzym des Methionin-Ausweich- 
Stoffwechselwegs ("Salvage Pathway"). Entsprechende Enzym- 
aktivitaten wurden nicht in Saugern, wohl aber in Pflanzen, 
Bakterien und Protozoen beschrieben. MTR Kinasen aus ver- 
schiedenen Arten wurden aufgrund definierter Sequenzmotive 
identifiziert (Sekowska A et al . (2001) BMC Microbiol 1:15; 
http://www.biomedcentral.eom/1471-2180/l/15) . Entsprechende 
Sequenzen und die Durchfuhrung negativer Selektionsverf ahren 
unter Einsatz von z.B. 5- (Trif luoromethyl) thioribose sind dem 
Fachmann bekannt und leicht aus entsprechenden Sequenzdaten- 
bank (z.B. GenBank) erhaltlich (Sekowska A et al . (2001) 
BMC Microbiol 1:15; Cornell KA et al . (1996) 317:285-290). 
Auf die im Rahmen der genannten Publikationen offenbarten 
Sequenzen, Materialien und Verfahren wird hiermit ausdruck- 
lich Bezug genommen. 

Eine pflanzliche MTR-Kinase ist bi slang jedoch nicht 
eindeutig identifiziert worden und wird im Rahmen des 
erfindungsgema£en Verfahrens bereitsgestellt (SEQ ID NO: 39 
bzw. 40) . Bevorzugt wird als Markerprotein eine pflanzliche, 
endogerie MTR-Kinase verwendet. 

Insbesondere bevorzugt sind Sequenzen entsprechend den Gen- 
Bank Acc. -No: AF212863 Oder AC079674 (Protein_ID=AAG51775 . 1) . 
Bevorzugt sind ferner Nukleinsauresequenzen, die fur Poly- 
peptide gemaS SEQ ID NO: 38 oder 40 kodieren, insbesondere 
die Sequenzen gemaiS SEQ ID NO: 37 oder 39. 

n) Alkoholdehydrogenasen (Adh) insbesondere pflanzliche Adh-1 
genprodukte, wobei bevorzugt Substanzen wie Allylalkohol 
als nicht toxische Substanz X eingesetzt werden, welche 
so zu der toxischen Substanz (Y) Acrolein umgesetzt wird. 
Entsprechende Sequenzen und die Durchfuhrung negativer 
Selektionsverf ahren unter Einsatz von z.B. Allylalkohol sind 
dem Fachmann bekannt und leicht aus entsprechenden Sequenz- 
datenbank (z.B. GenBank) erhaltlich (Wisman E et al . (1991) 
Mol Gen Genet 226 (1-2 ): 120-8 ; Jacobs M et al . (1988) Biochem 
Genet 26 (1-2 ): 105-22 ; Schwartz D. (1981) Environ Health 
Perspect 37:75-7) . Auf die im Rahmen der genannten Publi- 
kationen offenbarten Sequenzen, Materialien und Verfahren 
wird hiermit ausdrttcklich Bezug genommen. 

Insbesondere bevorzugt sind Sequenzen entsprechend den Gen- 
Bank Acc. -No: X77943, M12196, AF172282, X04049 oder AF253472. 
Bevorzugt sind ferner Nukleinsauresequenzen, die fur Poly- 
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peptide gemafc SEQ ID NO: 42, 44, 46 Oder 48 kodieren, ins- 
besondere die Sequenzen gemaS SEQ ID NO: 41, 43, 45 oder 47. 

(o) Weiterhin sind als negativer Selektionsmarker solche 
5 Sequenzen geeignet, die per se eine toxische Wirkung auf 

pflanzliche Zellen ausuben, wie beispielsweise Diptheriatoxin 
A, Ribonukleasen wie Barnase sowie Ribosom-inhibierende 
Proteine wie Ricin. Dabei werden diese Proteine bevorzugt in 
den pflanzlichen Zellen nicht konstitutiv, sondern induzier- 
10 bar exprimiert. Bevorzugt erfolgt die Induktion chemisch, 

wobei beispielsweise die unten erwahnten chemisch-induzier- 
baren Promotoren verwendet werden konnen, urn diese chemisch- • 
induzierte Expression zu gewahrleisten. 

15 "Verminderung" oder "vermindern" ist im Zusammenhang mit 

einem Markerprotein, bzw. seiner Menge, Expression, Aktivitat 
und/oder Funktion weit auszulegen und umfasst die teilweise 
Oder im wesentlichen vollstandige, auf unterschiedliche zell- 
biologische Mechanismen beruhende Unterbindung oder Blockierung 
20 der Funktionalitat eines Markerproteins in einer pflanzlichen 

Zelle, Pflanze oder einem davon abgeleiteten Teil, Gewebe, Organ, 
Zellen oder Samen. 

Eine Verminderung im Sinne der Erfindung umfasst auch eine 
25 mengenmaJSige Verringerung eines Markerproteins bis hin zu einem 
im wesentlichen vollstandigen Fehlen des Markerproteins (d.h. 
fehlende Nachweisbarkeit von Markerprotein- Aktivitat bzw. Marker- 
protein-Funktion oder fehlende immunologische Nachweisbarkeit 
des Markerproteins) . Dabei wird die Expression eines bestimmten 

30 Markerproteins (bzw. seiner Menge, Expression, Aktivitat und/oder 
Funktion) in einer Zelle oder einem Organismus bevorzugt urn mehr 
als 50 %, besonders bevorzugt urn mehr als 80 %, ganz besonders 
bevorzugt urn mehr als 90%, am meisten bevorzugt urn mehr als 
98 % vermindert. Insbesondere meint Verminderung auch das 

35 vollstandigen Fehlen des Markerproteins (bzw. seiner Menge, 

Expression, Aktivitat und/oder Funktion) . Dabei meint Aktivitat 
und/oder Funktion bevorzugt die Eigenschaft des Markerproteins 
einen toxischen Effekt auf die pflanzliche Zelle oder den pflanz- 
lichen Organismus auszuiiben bzw. die Fahigkeit die Substanz X 

40 in die Substanz Y umzusetzen. Bevorzugt wird als der durch 
das Markerprotein bewirkte toxische Effekt urn mehr als 50 %, 
besonders bevorzugt urn mehr als 80 %, ganz besonders bevorzugt 
urn mehr als 90%, am meisten bevorzugt urn mehr als 98 % ver- 
mindert. Selbst verstandliche umfasst "Verminderung" im Rahmen 

45 des erfindungsgemaEen Verfahrens auch eine vollstandige, 100%ige 
Verminderung oder Beseitigung des Markerproteins (bzw. seiner 
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Menge, Expression, Aktivitat und/oder Funktion) (z.B. durch 
Deletion des Markerprotein-Gens aus dem Genom) . 

ErfindungsgemaS sind verschiedene Strategien zur Verminderung der 
5 Expression, Menge, Aktivitat und/oder Funktion des Markerproteins 
umfasst. Der Fachmann erkennt, dass eine Reihe verschiedener 
Methoden zur Verfugung stehen, um die Expression, Menge, Aktivi- 
tat und/oder Funktion eines Markerproteins in gewunschter Weise 
zu beeinflussen. Beispielhaf t , jedoch nicht einschrankend, seien 
10 zu nennen: 

a) Einbringen mindestens einer doppelstrangigen Markerprotein 
Ribonukleinsauresequenz (MP-dsRNA) oder einer deren 
Expression gewahrleistenden Expressionskassette oder 

15 Expressionskassetten. Umfasst sind solche Verfahren, 

bei denen die MP-dsRNA gegen ein Markerprotein-Gen (also 
genomische DNA-Sequenzen wie Promotorsequenzen) oder ein 
Markerprotein-Gentranskript (also mRNA-Sequenzen) gerichtet 
ist. 

20 

b) Einbringen mindestens einer Markerprotein antisense-Ribo- 
nukleinsauresequenz (MP-antisenseRNA) oder einer deren 
Expression gewahrleistenden Expressionskassette. Umfasst 
sind solche Verfahren, bei denen die MP-antisenseRNA gegen 

25 ein Markerprotein-Gen (also genomische DNA-Sequenzen) 

oder ein Markerprotein-Gentranskript (also RNA-Sequenzen) 
gerichtet ist. Umfasst sind auch a-anomere Nukleinsaure- 
sequenzen. 

30 c) Einbringen mindestens einer MP-antisenseRNA kombiniert mit 
einem Ribozym oder einer deren Expression gewahrleistenden 
Expressionskassette 

d) Einbringen mindestens einer Markerprotein sense-Ribonuklein- 
sauresequenz (MP-senseRNA) zur Induktion einer Kosuppression 
oder einer deren Expression gewahrleistenden Expressionskas- 
sette 

e) Einbringen mindestens eines DNA-oder Protein-bindenden 
Faktors gegen ein Markerprotein-Gen, -RNA oder -Protein 
oder einer dessen Expression gewahrleistenden Expressions- 
kassette 

f ) Einbringen mindestens einer den Markerprotein RNA— Abbau 
bewirkenden viralen Nukleinsauresequenz oder einer deren 
Expression gewahrleistenden Expressionskassette 
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g) Einbringen mindestens eines Konstruktes zur Erzeugung eines 
Funktionsverlustes (z.B. Generierung von Stopp-Kodons , Ver- 
schiebungen im Leseraster etc . ) an einem Markerprotein-Gen 
beispielsweise durch Erzeugung einer Insertion, Deletion, 
5 Inversion oder Mutation in einem Markerprotein-Gen. Bevorzugt 

konnen Knockout-Mutanten mittels gezielter Insertion in 
besagtes Markerprotein-Gen durch homologer Rekombination 
oder Einbringen von sequenzspezif ischen Nukleasen gegen 
Markerprotein-Gensequenzen generiert werden. 

10 

Dem Fachmann ist bekannt, dass auch weitere Verfahren im Rahmen 
der vorliegenden Erf indung zur Verminderung eines Markerproteins 
bzw. seiner Aktivitat oder Funktion eingesetzt werden konnen. 
Beispielsweise kann auch - je nach Art des verwendeten Marker- 

15 proteins - das Einbringen einer dominant-negativen Variante eines 
Markerproteins oder einer deren Expression gewahrleistenden 
Expressionskassette vorteilhaft sein. Dabei kann jedes einzelne 
dieser Verfahren eine Verminderung der Expression, Menge, Aktivi- 
tat und/oder Funktion eines Markerproteins bewirken. Auch eine 

20 kombinierte Anwendung ist denkbar. Weitere Methoden sind dem 
Fachmann bekannt und konnen die Behinderung oder Unterbindung 
der Prozessierung des Markerproteins, des Transports des Marker- 
proteins oder des sen mRNA, Hemmung der Ribosomenanlagerung, 
Hemmung des RNA-SpleiiSens , Induktion eines Markerprotein-RNA 

25 abbauenden Enzyms und/oder Hemmung der Translationselongation 
oder -termination umfassen. 

Die einzelnen bevorzugten Verfahren seien infolge durch beispiel- 
hafte Ausfuhrungsformen beschrieben: 

30 

a) Einbringen einer doppelstrangigen Ribonukleinsauresequenz 
eines Markerproteins (MP-dsRNA) 

Das Verfahren der Genregulation mittels doppelstrangiger RNA 
35 ("double-stranded RNA interference"; dsRNAi) ist vielfach 
fur tierische und pflanzliche Organismen beschrieben (z.B. 
Matzke MA et al . (2000) Plant Mol Biol 43:401-415; Fire A. et al 
(1998) Nature 391:806-811; WO 99/32619; WO 99/53050; WO 00/68374; 
WO 00/44914; WO 00/44895; WO 00/49035; WO 00/63364). Auf die 
40 in den angegebenen Zitaten beschriebenen Verfahren und Methoden 
wird hiermit ausdrticklich Bezug genommen. dsRNAi -Verfahren 
beruhen auf dem Phanomen, dass durch gleichzeitiges Einbringen 
von komplementSren Strang- und Gegenstrang eines Gentranskriptes 
eine hochef f iziente Unterdruckung der Expression des ent- 
45 sprechenden Gens bewirkt wird. Der bewirkte Phanotyp kommt 

dem einer entsprechenden knock-out Mutanten sehr ahnlich (Water- 
house PM et al. (1998) Proc Natl Acad Sci USA 95:13959-64). Das 
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dsRNAi-Verfahren hat sich bei der Verminderung der Markerprotein- 
Expression als besonders effizient und vorteilhaft erwiesen. 

Doppelstrangiges RNA-Molekiil meint im Rahmen der Erfindung bevor- 
5 zugt eine oder mehr RibonukleinsSuresequenzen, die aufgrund 
komplementarer Sequenzen theoretisch (z.B. gemaS den Basenpaar- 
regeln von Waston und Crick) und/oder faktisch (z.B. aufgrund 
von Hybridisierungsexperimenten in vitro und/oder in vivo) in 
der Lage sind, doppelstrangige RNA-Strukturen auszubilden. Dem 
10 Fachmann ist bewusst, dass die Ausbildung von doppelstr&ngigen 
RNA-Strukturen, einen Gleichgewichtszustand darstellt. Bevor- 
zugt ist das Verhaltnis von doppelstrangigen Molekulen zu ent- 
sprechenden dissozierten Formen mindestens 1 zu 10, bevorzugt 
1:1, besonders bevorzugt 5:1, am meisten bevorzugt 10:1. 

15 

Ein weiterer Gegenstand der Erfindung bezieht sich daher 
auf doppelstrangige RNA-Molekiil e (dsRNA-Molekule) , die bei 
Einbringen in einen pflanzlichen Organismus (oder eine davon 
abgeleitete Zelle, Gewebe, Organ oder Vermehrungsmaterial) 
20 die Verminderung mindestens ein^s Markerproteins bewirken. 

Das doppelstrangige RNA-Molekiil zur Verminderung der Expression 
eines Markerproteins (MP-dsRNA) umfasst dabei bevorzugt 

a) einen w sense" -RNA-Strang umfassend mindestens eine Ribo- 
25 nukleotidsequenz, die im wesentlichen identisch ist zu 

mindestens einem Teil des * sense "-RNA-Transkriptes einer 
Nukleinsauresequenz kodierend fur ein Markerprotein, und 

b) einen "anti sense "-RNA-Strang, der zu dem RNA-" sense "-Strang 
30 unter a) im wesentlichen - bevorzugt vol 1 standi g - komplemen- 

taren ist. 



In Bezug auf die dsRNA-Molekiile meint Markerprotein-Nukleinsaure- 
sequenz bevorzugt eine Sequenz gema£ SEQ ID NO: 1, 3, 5, 7, 9, 
35 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39^ 41, 
43, 45 oder 47 oder ein funktionelles Equivalent derselben. 

"Im wesentlichen identisch" meint, dass die dsRNA Sequenz auch 
Insertionen, Deletionen sowie einzelne Punktmutationen im Ver- 

40 gleich zu der Markerprotein Zielsequenz aufweisen kann und 
dennoch eine effizient Verminderung der Expression bewirkt. 
Bevorzugt betragt die Homologie (nach weiter unten folgender 
Definition) mindestens 75 %, bevorzugt mindestens 80 %, ganz 
besonders bevorzugt mindestens 90 % am meisten bevorzugt 100 % 

45 zwischen dem » sense" -Strang einer inhibitorischen dsRNA und 

mindestens einem Teil des n sense"-RNA-Transkriptes einer Nuklein- 
sauresequenz kodierend fur ein Markerprotein (bzw. zwischen dem 
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"antisense" -Strang dem komplementaren Strang einer Nukleinsaure- 
sequenz kodierend fur ein Markerprotein) . 

Eine 100%ige Sequenzidentitat zwischen dsRNA und einem Marker- 
5 protein Gentranskript ist nicht zwingend erf orderlich, um eine 
effiziente Verminderung der Markerprotein Expression zu bewirken. 
Demzufolge besteht der Vorteil, dass das Verfahren tolerant 
ist gegenuber Sequenzabweichungen, wie sie infolge genetischer 
Mutationen, Polymorphismen oder evolutionarer Divergenzen vor- 
10 liegen kSnnen. So ist es beispielsweise moglich mit der dsRNA, 
die ausgehend von der Markerprotein Sequenz des einen Organismus 
generiert wurde, die Markerprotein Expression in einem anderen 
Organismus zu unterdriicken . Dies ist besonders dann vorteilhaft, 
wenn als Markerprotein ein pf lanzenei genes, endogenes Marker- 
15 protein verwendet wird (beispielsweise eine 5-Methylthioribose- 
kinase oder Alkoholdehydrogenase) . Zu diesem Zweck umfasst 
die dsRNA bevorzugt Sequenzbereiche von Markerprotein-Gen- 
transkripten, die konservierten Bereichen entsprechen. Besagte 
konservierte Bereiche konnen aus Sequenzvergleichen leicht 
2Q abgeleitet werden. 

Die Lange des Teilabschnittes betragt mindestens 10 Basen, 
bevorzugt mindestens 25 Basen, besonders bevorzugt mindestens 
50 Basen, ganz besonders bevorzugt mindestens 100 Basen, am 
25 meisten bevorzugt mindestens 2 00 Basen oder mindestens 300 Basen. 

Alternativ, kann eine "im wesentlichen identische" dsRNA auch als 
Nukleinsauresequenz definiert werden, die befahigt ist, mit einem 
Teil eines Markerprotein Gentranskriptes zu hybridisieren (z.B. 
3Q in 400 mM NaCl, 40 mM PIPES pH 6,4, 1 mM EDTA bei 50°C oder 70°C 
ftir 12 bis 16 h) . 

"Im wesentlichen komplementar" meint, dass der "antisense"- 
RNA-Strang auch Insertionen, Deletionen sowie einzelne Punkt- 
3s mutationen im Vergleich zu dem Komplement des "sense"-RNA- 

Stranges aufweisen kann. Bevorzugt betragt die Homologie min- 
destens 80 %, bevorzugt mindestens 90 %, ganz besonders bevorzugt 
mindestens 95 %, am meisten bevorzugt 100% zwischen dem "anti- 
sens e"-RNA- Strang und dem Komplement des » sense " -RNA-Stranges . 

40 

"Teil des "sense»-RNA-Transkriptes'' einer Nukleinsauresequenz 
kodierend ftir ein Markerprotein meint Fragmente einer RNA oder 
mRNA transkribiert oder transkribierbar von einer fur ein Marker- 
protein kodierenden Nukleinsauresequenz, bevorzugt von einem 
45 Markerprotein-Gen. Dabei haben die Fragmente bevorzugt eine 
Sequenzlange von mindestens 2 0 Basen, bevorzugt mindestens 
50 Basen, besonders bevorzugt mindestens 100 Basen, ganz 
besonders bevorzugt mindestens 200 Basen, am meisten bevorzugt 
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mindestens 500 Basen. Umfasst ist auch die vollstandige 
transkribierte RNA oder mRNA. Umfasst sind auch Sequenzen wie 
sie unter kunstlichen Bedingungen von Regionen eines Marker- 
protein-Gens transkribiert werden konnen, die ansonsten - unter 
5 natiirlichen Bedingungen - nicht transkribiert werden, wie bei- 
spielsweise Promotorregionen. 

Die dsRNA kann aus einem oder mehr Strangen von Polyribonukleo- 
tiden bestehen. Natiirlich konnen, urn den gleichen Zweck zu 

10 erreichen, auch mehrere individuelle dsRNA MolekQle, die jeweils 
einen der oben definierten Ribonukleotidsequenzabschnitte um- 
fassen, in die Zelle oder den Organismus eingebracht werden. Die 
doppelstrangige dsRNA-Struktur kann ausgehend von zwei komplemen- 
taren, separaten RNA-Strangen oder - bevorzugt - ausgehend von 

15 einem einzelnen, selbstkomplementaren RNA-Strang gebildet werden. 
In diesem Fall sind " sense "-RNA-Strang und "antisense"-RNA-Strang 
bevorzugt kovalent in Form eines invertierten * Repeats " mitein- 
ander verbunden. 

20 Wie z.B. in WO 99/53050 beschrieben, kann die dsRNA auch eine 

Haarnadelstruktur umfassen, indem tt sense"- und *antisense ff -Strang 
durch eine verbindende Sequenz ("Linker"; beispielsweise ein 
Intron) verbunden werden. Die selbstkomplementaren dsRNA-Struk- 
turen sind bevorzugt, da sie lediglich die Expression einer RNA— 

25 Sequenz erfordern und die komplementaren RNA- Strange stets in 
einem aquimolaren Verhaltnis umfassen. Bevorzugt kann ist die 
verbindende Sequenz ein Intron (z.B. ein Intron des ST-LS1 Gens 
aus Kartoffel; Vancanneyt GF et al . (1990) Mol Gen Genet 
220(2) :245-250) . 

30 

Die Nukleinsauresequenz kodierend fur eine dsRNA kann weitere 
Elemente beinhalten, wie beispielsweise Transkriptionstermina- 
tionssignale oder Polyadenylierungssignale . 

35 Sollen die zwei Strange der dsRNA in einer Zelle oder Pflanze 
zusammengebracht werden, so kann dies beispielhaft auf folgende 
Art geschehen: 



a) Transformation der Zelle oder Pflanze mit einem Vektor, der 
40 beide Expressionskassetten umfasst, 

b) Kotransformation der Zelle oder Pflanze mit zwei Vektoren, 
wobei der eine die Expressionskassetten mit dem "sense"- 
Strang, der andere die Expressionskassetten mit dem "anti- 

45 sense"-Strang umfasst. 
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Die Bildung der RNA Duplex kann entweder augerhalb der Zelle oder 
innerhalb derselben initiiert werden. 

Die dsRNA kann entweder in vivo oder in vitro synthetisiert 
5 werden. Dazu kann eine DNA-Sequenz kodierend fur eine dsRNA 
in eine Expressionskassette unter Kontrolle mindestens eines 
genetischen Kontrollelementes (wie beispielsweise einem Promotor) 
gebracht werden. Eine Polyadenylierung ist nicht erf orderlich, 
ebenso mussen keine Elemente zur Initiierung einer Translation 

10 vorhanden sein. Bevorzugt ist die Expressionskassette ftir die MP- 
dsRNA auf dem Transf ormationskonstrukt oder dem Transformations- 
vektor enthalten. Die Expressionskassetten kodierend fur den 
"antisense"- und/oder den U sense"-Strang einer MP-dsRNA oder fiir 
den selbstkomplementaren-Strang der dsRNA # werden dazu bevorzugt 

15 in einen Trans format ionsvektor insertiert und mit den unten 

beschriebenen Verfahren in die pflanzliche Zelle eingebracht. Fur 
das Erfindungsgema£e Verfahren kann eine stabile Insertion in das 
Genom vorteilhaft sein, ist aber nicht zwingend erf orderlich. Da 
eine dsRNA einen langanhaltenden Effekt bewirkt, ist in vielen 

20 FSllen auch eil *e transiente Expression ausreichend. Die dsRNA 

kann auch Teil der von der zu insertierenden Nukleinsauresequenz 
zu exprimierenden RNA sein, indem sie beispielsweise an den 
3'-untranslatierten Teil besagter RNA fusioniert wird. 

Die dsRNA kann in einer Menge eingeftihrt werden, die zumindest 
25 eine Kopie pro Zelle ermoglicht. Hohere Mengen (z.B. mindestens 
5, 10, 100, 500 oder 1000 Kopien pro Zelle) kormen ggf . eine 
effizienter Verminderung bewirken. 

b) Einbringen einer antisense-Ribonukleinsauresequenz eines 
30 Markerproteins (MP-antisenseRNA) 

Verfahren zur Verminderung eines bestimmten Proteins durch die 
u antisense"-Technologie sind vielfach - auch in Pflanzen - 
beschrieben (Sheehy et al . (1988) Proc Natl Acad Sci USA 85: 

35 8805-8809; US 4,801,340; Mol JN et al . (1990) FEBS Lett 

268 (2) : 427-430) . Das antisense Nukleinsauremolektil hybridisiert 
bzw. bindet mit der zellularen mRNA und/oder genomischen DNA 
kodierend fur das zu vermindernde Markerprotein. Dadurch wird 
die Transkription und/oder Translation des Markerproteins unter- 

40 drtickt. Die Hybridisierung kann auf konventionelle Art ttber die 
Bildung einer stabilen Duplex oder - im Fall von genomischer 
DNA - durch Bindung des antisense Nukleinsauremolekuls mit der 
Duplex der genomischen DNA durch spezifische Wechselwirkung in 
der grofcen Furche der DNA-Helix entstehen. 

45 

Eine MP-antisenseRNA kann unter Verwendung der fiir dieses 
Markeirprotein kodierenden Nukleinsauresequenz, beispielsweise 
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der Nukleinsauresequenz gemag SEQ ID NO: 1, 3, 5, 7, 9, 11, 13, 
15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45' 
Oder 47 nach den Basenpaarregeln von Watson und Crick abgeleitet 
werden. Die MP-antisenseRNA kann zu der gesamten transkribierten 
5 mRNA des Markerproteins komplementar sein, sich auf die kodie- 
rende Region beschranken Oder nur aus einem Oligonukleotid be- 
stehen, das zu einem Teil der kodierenden oder nicht-kodierenden 
Sequenz der mRNA komplementar ist. So kann das Oligonukleotid 
beispielsweise komplementar zu der Region sein, die den Trans- 

10 lationsstart fur das Markerprotein umfasst. Die MP-antisenseRNA 
kann eine Lange von zum Beispiel 5, 10, 15, 20, 25, 30, 35, 40, 
45 oder 50 Nukleotide haben, kann aber auch langer sein und min- 
destens 100, 200, 500, 1000, 2000 oder 5000 Nukleotide umfassen. 
MP-antisenseRNA werden im Rahmen des erf indungsgemaSen Verfahrens 

15 bevorzugt rekombinant in der Zielzelle exprimiert. 

Die MP-antisenseRNA kann auch Teil einer von der zu insertieren- 
den Nukleinsauresequenz zu exprimierenden RNA sein, indem sie 
beispielsweise an den 3 ' -untranslatierten Teil besagter RNA 
fusioniert ist. 



Ein weiterer Gegenstand der Erfindung betrifft transgene 
Expressionskassetten enthaltend eine Nukleinsauresequenz 
kodierend fur zumindest einen Teil eines Markerproteins, wobei 
besagte Nukleinsauresequenz mit einem in pflanzlichen Organismen 
25 funktionellen Promotor in ant i sense- Or ientierung funktionell 
verknupft ist. Besagte Expressionskassetten konnen Teil eines 
Transformationskonstruktes oder Trans format ionsvektors sein, oder 
aber auch im Rahmen einer Kotransf ormation eingefuhrt werden. 

30 in einer weiteren bevorzugten Aus fuhrungs form kann die Expression 
eines Markerproteins durch Nukleotidsequenzen inhibiert werden, 
die komplementar zu der regulatorischen Region eines Marker- 
protein-Gens (z.B. einem Markerprotein Promoter und/oder 
Enhancer) sind und triple-helikale Strukturen mit der dortigen 

35 DNA-Doppelhelix ausbilden, so dass die Transkription des Marker - 
protein-Gens vermindert wird. Entsprechende Verfahren sind 
beschrieben (Helene C (1991) Anticancer Drug Res 6(6):569-84; 
Helene C et al . (1992) Ann NY Acad Sci 660:27-3 6; Maher LJ (1992) 
Bioassays 14 (12) : 807-815) . 

40 

In einer weiteren Ausf uhrungsf orm kann die MP-antisenseRNA eine 
cc-anomere Nukleinsaure sein. Derartige oe-anomere Nukleinsaure- 
molekiile bilden spezifische doppelstrangige Hybride mit komple- 
mentSrer RNA in denen, - im Unterschied zu den konventionellen 
45 P-Nukleinsauren - die beiden Strange parallel zueinander verlaufen 
(Gautier C et al. (1987) Nucleic Acids Res 15:6625-6641). 



20 
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c) Einbringen einer MP-antisenseRNA kombiniert mit einem Ribozym 

Vorteilhaft kann die oben beschriebene antisense-Strategie mit 
einem Ribozym- Verfahren gekoppelt werden. Katalytische RNA-Mole- 
5 kiile oder Ribozyme konnen an jede beliebige Ziel-RNA angepasst 
werden und spalten das Phosphodiester-Gerust an spezifischen 
Positionen, wodurch die Ziel-RNA funktionell deaktiviert wird 
(Tanner NK (1999) FEMS Microbiol Rev 23 (3 ): 257-275 ) . Das Ribozym 
wird dadurch nicht selber modifiziert, sondern ist in der Lage, 

XQ weitere Ziel-RNA-Molekule analog zu spalten, wodurch es die 
Eigenschaf ten eines Enzyms erhalt. Der Einbau von Ribozym- 
sequenzen in "antisense^-RNAs verleiht eben diesen "anti- 
sense"-RNAs diese enzymahnliche, RNA-spaltende Eigenschaft und 
steigert so deren Effizienz bei der Inaktivierung der Ziel-RNA. 

15 Die Herstellung und Verwendung entsprechender Ribozym- "ant i- 
sense"-RNA-Molekule ist beschrieben (u.a. bei' Haselof f et al . 
(1988) Nature 334: 585-591); Haselhoff und Gerlach (1988) Nature 
334:585-591; Steinecke P et al . (1992) EMBO J 11(4):1525- 1530; 
de Feyter R et al. (1996) Mol Gen Genet. 250(3) : 329-338) . 

20 

Auf diese Art konnen Ribozyme (z.B. tt Hammerhead ,/ -Ribo zyme ; 
Haselhoff und Gerlach (1988) Nature 334:585-591) verwendet 
werden, um die mRNA eines zu vermindernden Markerproteins 
katalytisch zu spalten und so die Translation zu verhindern. 
Die Ribozym-Technologie kann die Effizienz einer antisense- 

25 

Strategie erhohen. Verfahren zur Expression von Ribozymen 
zur Verminderung bestimmter Proteine sind beschrieben in 
(EP 0 291 533, EP 0 321 201, EP 0 360 257). In pflanzlichen 
Zellen ist eine Ribozym-Expression ebenfalls beschrieben 
(Steinecke P et al . (1992) EMBO J 11 (4) : 1525-1530; de Feyter R 

30 et al. (1996) Mol Gen Genet. 250 (3 ): 329-338 ) . Geeignete Ziel- 
sequenzen und Ribozyme konnen zum Beispiel wie bei "Steinecke P, 
Ribozymes, Methods in Cell Biology 50, Galbraith et al . eds, 
Academic Press, Inc. (1995), S. 449-460" beschrieben, durch 
Sekundarstrukturberechnungen von Ribozym- und Ziel-RNA sowie 

35 durch deren Interaktion bestimmt werden (Bayley CC et al . (1992) 
Plant Mol Biol. 18(2) : 353-361; Lloyd AM and Davis RW et al . 
(1994) Mol Gen Genet. 242 (6) : 653-657) . Beispielsweise konnen 
Derivate der Tetrahymena L-19 IVS RNA konstruiert werden, die 
komplementare Bereiche zu der mRNA des zu supprimierenden Marker- 

40 proteins aufweisen (siehe auch US 4,987,071 und US 5,116,742). 
Alternativ konnen solche Ribozyme auch uber einen Selektions- 
prozess aus einer Bibliothek diverser Ribozyme identif iziert 
werden (Bartel D und Szostak JW (1993) Science 261:1411-1418). 



45 
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d) Einbringen einer sense-Ribonukleinsauresequenz eines Marker- 
proteins (MP-senseRNA) zur Induktion einer Kosuppression 

Die Expression einer Markerprotein Ribonukleinsauresequenz 
5 (oder eines Teils derselben) in sense-Orientierung kann zu einer 
Kosuppression des entsprechenden Markerproteingens fiihren. Die 
Expression von sense-RNA mit Homologie zu einem endogenen Marker- 
proteingen kann die Expression desselben vermindern oder aus- 
schalten, ahnlich wie es fur antisense Ansatze beschrieben wurde 

10 (Jorgensen et al . (1996) Plant Mol Biol 31 (5) : 957-973 ; Goring 
et al. (1991) Proc Natl Acad Sci USA 88:1770-1774; Smith et al . 
(1990) Mol Gen Genet 224:447-481; Napoli et al . (1990) Plant Cell 
2:279-289; Van der Krol et al . (1990) Plant Cell 2:291-99). Dabei 
kann das eingefiihrte Konstrukt das zu vermindernde , homologe 

15 Gen ganz oder nur teilweise reprasentieren. Die Moglichkeit 
zur Translation ist nicht erf orderlich. Die Anwendung dieser 
Technologie auf Pflanzen ist beschrieben (z.B. Napoli et al . 
(1990) Plant Cell 2:279-289; in US 5,034,323. 

20 Bevorzugt wird die Kosuppressiorx unter Verwendung einer Sequenz 
realisiert, die im wesentlichen identisch ist zu zumindest einem 
Teil der Nukleinsauresequenz kodierend fur ein Markerprotein, 
beispielsweise der Nukleinsauresequenz gemaS SEQ ID NO: 1, 3, 
5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29 ,31, 33, 35,' 

25 37, 39, 41, 43, 45 oder 47. 

Bevorzugt ist die MP-senseRNA so gewahlt, dass es nicht zu einer 
Translation des Markerproteins oder eines Teils desselben kommen 
kann. Dazu kann beispielsweise der 5 ' -untranslatierte oder 
30 3 '-untranslatierte Bereich gewahlt oder aber das ATG-Startkodon 
deletiert oder mutiert werden. 

e) Einbringen von DNA-oder Protein-bindende Faktoren gegen 
Markerprotein Gene, -RNAs oder Proteine 

35 

Eine Verminderung einer Markerprotein Expression ist auch mit 
spezifischen DNA-bindenden Faktoren z.B. mit Faktoren vom Typ der 
Zinkfingertranskriptionsfaktoren moglich. Diese Faktoren lagern 
sich an die genomische Sequenz des endogenen Zielgens, bevor- 

40 zugt in den regulatorischen Bereichen, an und bewirken eine Ver- 
minderung der Expression. Entsprechende Verfahren zur Herstellung 
entsprechender Faktoren sind beschrieben (Dreier B et al. (2001) 
J Biol Chem 276 (31) :29466-78; Dreier B et al . (2000) J Mol 
Biol 303(4) :489-502; Beerli RR et al . (2000) Proc Natl Acad 

45 Sci USA 97 (4) : 1495-1500; Beerli RR et al . (2000) J Biol Chem 
275(42) :32617-32627; Segal DJ and Barbas CF 3rd. (2000) Curr 
Opin Chem Biol 4(1) :34-39; Rang JS and Kim JS (2000) J Biol Chem 
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275(12) :8742-8748; Beerli RR et al . (1998) Proc Natl Acad Sci USA 
95 (25) :14628- 14633; Kim JS et al . (1997) Proc Natl Acad Sci USA 
94(8):3616 -3620; Klug A (1999) J Mol Biol 293 (2 ): 215-218 ; Tsai 
SY et al. (1998) Adv Drug Deliv Rev 30 (1-3) :23-31; Mapp AK et al . 
5 (2000) Proc Natl Acad Sci USA 97 (8) : 3930-3935 ; Sharrocks AD 

et al. (1997) Int J Biochem Cell Biol 29 (12) ; 1371-1387; Zhang L 
et al. (2000) J Biol Chem 275 (43) : 33850-33860) . 

Die Selektion dieser Faktoren kann unter Verwendung eines 
10 beliebigen Stuckes eines Markerprotein-Gens erfolgen. Bevorzugt 
liegt dieser Abschnitt im Bereich der Promotorregion. Fur eine 
Genunterdrtickung kann er aber auch im Bereich der kodierenden 
Exons oder Introns liegen. 

15 Werner konnen Faktoren in eine Zelle eingebracht werden, die das 
Markerprotein selber inhibieren. Diese proteinbindenden Faktoren 
konnen z.B. Aptamere (Famulok M und Mayer G (1999) Curr Top 
Microbiol Iinniunol 243:123-36) oder Antikdrper bzw. Antikorper- 
fragmente oder einzelkettige Antikorper sein. Die Gewinnung die- 

20 ser Faktoren ist beschrieben (Owen M et al . (1992) Biotechnology 
(N Y) 10(7) :790-794; Franken E et al . (1997) Curr Opin Biotechnol 
8 (4) :411-416; Whitelam (1996) Trend Plant Sci 1:286-272). 

f ) Einbringen von den Markerprotein RNA-Abbau bewirkenden 
25 viralen Nukleinsauresequenzen und Expressionskonstrukten 

Die Markerprotein Expression kann effektiv auch durch Induktion 
des spezifischen Markerprotein RNA-Abbau s durch die Pflanze 
mit Hilfe eines viralen Expressionssystems (Amplikon; Angell 

30 SM et al. (1999) Plant J 20 (3) : 357-362) realisiert werden. 

Diese Systeme - auch als "VTGS" (viral induced gene silencing) 
bezeichnet - bringen Nukleinsauresequenzen mit Homologie 
zu dem Transkript eines zu vermindernden Markerproteins 
mittels viraler Vektoren in die Pflanze ein. Die Transkription 

35 wird sodann - vermutlich mediiert durch pflanzliche Abwehr- 

mechanismen gegen Viren - abgeschaltet . Entsprechende Techniken 
und Verfahren sind beschrieben (Ratcliff F et al . (2001) Plant J 
25 (2) :237-45; Fagard M und Vaucheret H (2000) Plant Mol Biol 
43 (2-3) :285-93; Anandalakshmi R et al . (1998) Proc Natl Acad Sci 

40 USA 95(22) :13079-84; Ruiz MT (1998) Plant Cell 10 (6) : 937-46) . 

Bevorzugt wird die VIGS-vermittelte Verminderung unter Verwendung 
einer Sequenz realisiert, die im wesentlichen identisch ist 
zu zumindest einem Teil der Nukleinsauresequenz kodierend fur 
45 ein Markerprotein, beispielsweise der Nukleinsauresequenz gema£ 
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SEQ ID NO: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 
29, 31, 33, 35, 37, 39, 41, 43, 45 oder 47. 

g) Einbringen von Konstrukten zur Erzeugung eines Funktions- 
5 verlustes oder einer Funktionsminderung an Markerprotein- 

Genen 

Dem Fachmann sind zahlreiche Verfahren bekannt, wie genomische 
Sequenzen gezielt modifiziert werden konnen. Dazu zahlen ins- 

10 besondere Verfahren wie die Erzeugung von Knockout-Mutanten 

mittels gezielter homologen Rekombination z.B. durch Generierung 
von Stopp-Kodons, Verschiebungen im Leseraster etc. (Hohn B und 
Puchta H (1999) Proc Natl Acad Sci USA 96:8321-8323) oder die 
gezielte Deletion oder Inversion von Sequenzen mittels z.B. 

15 sequenzspezif ischer Rekombinasen oder Nukleasen (s.u.) 

In einer bevorzugten Ausf iihrungsf orm wird die Inaktivierung des 
Markerprotein-Gens durch Einbringen einer sequenzspezif ischen 
Rekombinase realisiert. So kann beispielsweise das Markerprotein- 

20 gen Erkermungs sequenzen fur sequenzspezif ische Rekombinasen 
umfassen oder von solchen flankiert sein, wobei dann durch 
Einbringen der Rekombinase bestimmte Sequenzen des Markerprotein- 
gens deletiert oder invertiert werden und so eine Inaktivierung 
des Markerproteinsgens erfolgt. Ein entsprechendes Vorgehen ist 

25 schematisch in Fig. 1 dargestellt. 

Entsprechende Verfahren zur Deletion/ Inversion von Sequenzen 
mittels sequenzspezifischer Rekombinasesysteme sind dem Fachmann 
bekannt. Beispielhaft seien zu nennen das Cre/lox- System des 

30 Bacteriophagen PI (Dale EC und Ow DW (1991) Proc Natl Acad 

Sci USA 88:10558-10562; Russell SH et al . (1992) Mol Gen Genet 
234:49-59; Osborne BI et al . (1995) Plant J 7:687-701), das FLP / 
FRT System der Hefe (Kilby NJ et al . (1995) Plant J 8:637-652; 
Lyznik LA et al . (1996) Nucl Acids Res 24:3784-3789), die Gin 

35 Rekombinase des Mu Phagen, die Pin Rekombinase aus E.coli oder 

das R/RS System des pSRl Plasmids (Onouchi H et al.(1995) Mol Gen 
Genet 247:653- 660; Sugita Ket al . (2000) Plant J. 22:461-469). 
Bei diesen Systemen interagiert die Rekombinase (beispielsweise 
Cre oder FLP) spezifisch mit ihren jeweiligen Rekombinations- 

40 sequenzen (34 bp lox-Sequenz bzw. 47 bp FRT-Sequenz) . Bevorzugt 
sind das Bacteriophagen PI Cre/lox und das Hefe FLP /FRT System. 
Das FLP /FRT und cre/lox Rekombinase system wurde bereits in 
pflanzlichen Systemen angewendet (Odell et al . (1990) Mol 
Gen Genet 223:369-378) . Das Einbringen der Rekombinase wird 

45 bevorzugt mittels rekombinanter Expression ausgehend von einer 
auf einem DNA-Konstrukt umfassten Expressionskassette realisiert. 
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Die Verminderung der Markerprotein-Aktivitat oder -Menge kann 
auch durch eine gezielte Deletion im Markerprotein-Gen z.B. durch 
seguenzspezif ische Induktion von DNA-Doppelstrangbruchen an einer 
Erkennungs sequenz zur gezielten Induktion von DNA-Doppelstrang- 
5 briichen in oder in der Nahe der Nukleinsauresequenz kodierend 
fur ein Markerprotein realisiert werden. In seiner einfachsten 
Ausfuhrungsform <vgl . Fig. 2, A und B) wird hierbei ein Enzym 
mit dem Trans format ions konstrukt eingebracht, dass mindestens 
einen Doppelstrangbruch derart erzeugt, dass die resultierende 
10 illegitime Rekombination oder Deletion eine Verminderung der 
Markerprotein-Aktivitat oder -Menge - beispielsweise durch 
Induzieren einer Verschiebung im Leseraster oder Deletion 
essentieller Sequenzen - bewirkt. 

15 Die Effizienz dieses Ansatz kann gesteigert werden, indem die 

Sequenz kodierend ftir das Markerprotein von Sequenzen (A bzw. A') 
flankiert ist, die eine ausreichende Lange und Homologie zuein- 
ander haben, um infolge des induzierten Doppelstrangbruch.es mit- 
einander zu rekombinieren und so - durch eine intramolekulare 

20 homologe Rekombination - eine Deletion der Sequenz kodierend fur 
das Markerprotein zu bewirken. Ein entsprechendes Vorgehen ist 
in einer beispielhaf ten Ausfuhrungsf orm dieser Variante in Fig. 3 
schematisch dargestellt. 

25 Die Verminderung der Markerprotein-Menge , -Funktion und/oder - 
Aktivitat kann auch durch eine gezielte Insertion von Nuklein- 
sauresequenzen (z.B. der im Rahmen der erf indungsgemafien Ver- 
fahrens zu insertierenden Nukleinsauresequenz) in die Sequenz 
kodierend fur ein Markerprotein (z.B. mittels intermolekularer 

30 homologer Rekombination) realisiert werden. Diese Ausfuhrungsform 
des erfindungsgema&en Verfahrens ist besonders vorteilhaft und 
bevorzugt, da es neben den allgemeinen Vorteilen des erfindungs- 
gema^en Verfahrens zudem noch eine reproduzierbare, vorhersag- 
bare, ortsspezif ische Insertion der zu insertierenden Nuklein- 

35 sauresequenz in das pflanzliche Genom ermoglicht. Dadurch werden 
die ansonsten im Rahmen einer zufalligen, ortsunspezif ischen 
Insertion auftretenden Positionsef f ekte (die sich beispielsweise 
in Form von unterschiedlichen Express ionshohen des Transgens oder 
einer unbeabsichtigen Inaktivierung endogener Gene auSern k5nnen) 

40 vermieden. Im Rahmen dieser Ausfuhrungsform verwendet man als 
"anti-Markerprotein^-Verbindung bevorzugt ein DNA-Konstrukt , 
das zumindest einen Teil der Sequenz eines Markerproteingens 
oder benachbarter Sequenzen umfasst, und so mit diesen in 
der Zielzelle gezielt rekombinieren kann, so dass durch eine 

45 Deletion, Addition oder Substitution mindestens eines Nukleotids 
das Markerproteingen so verandert wird, dass die Funktionalitat 
des Markerprotein-Gens vermindert oder ganzlich aufgehoben wird. 
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Die Veranderung kann auch die regulativen Elemente (z.B. 
den Promo tor) des Markerprotein-Gens betreffen, so dass 
die kodierende Sequenz unverandert bleibt, eine Expression 
(Transkription und/oder Translation) jedoch unterbleibt und 
5 vermindert wird. Bei der konventionellen homologen Rekombination 
ist die zu insertierende Sequenz an ihrem 5'- und/oder 3'-Ende 
von weiteren Nukleinsauresequenzen (A' bzw. B') flankiert, die 
eine ausreichende Lange und Homologie zu entsprechenden Sequenzen 
des Markerprotein-Gens (A bzw. B) fur die Ermoglichung der homo- 

10 logen Rekombination aufweisen. Die Lange liegt in der Regel in 
einem Bereich von mehreren hundert Basen bis zu mehreren Kilo- 
basen (Thomas KR und Capecchi MR (1987) Cell 51:503; Strepp 
et al. (1998) Proc Natl Acad Sci USA 95 (8) :4368-4373) . Fur 
die homologe Rekombination wird die pflanzliche Zelle mit dem 

15 Rekombinationskonstrukt unter Verwendung der unten beschriebenen 
Verfahren trans formiert und erfolgreich rekombinierte Klone 
basierend auf dem infolge inaktivierten Markerprotein selektio- 
niert. Obgleich homologe. Rekombination ein relativ seltenes 
Ereignis in pflanzlichen Organismen ist, kann durch die Rekombi- 

20 nation in das Markerprotein-Gen hinein einem Selektionsdruck aus- 
gewichen werden, was eine Selektion der rekombinierten Zellen 
und eine hinreichende Effizienz des Verfahrens erlaubt. Ein ent- 
sprechendes Vorgehen ist in einer beispielhaf ten Ausfuhrungsf orm 
dieser Variante in Fig. 4 schematised dargestellt. 

25 

In einer vorteilhaf ten Ausfuhrungsf orm der Erfindung wird 
jedoch die Insertion in das Markerproteingen mittels weiterer 
Funktionselemente erleichtert. Der Begriff ist umfassend zu ver- 
stehen und meint die Verwendung von Sequenzen bzw. von diesen 

30 abgeleiteten Transkripten oder Polypeptides die die Effizienz 
der gezielten Integration in ein Markerprotein-Gen zu steigern 
verm6gen. Dazu stehen dem Fachmann verschiedene Verfahren zur 
Verfiigung. Bevorzugt wird jedoch die Insertion durch Induktion 
eines sequenzspezif ischen Doppelstrangbrucb.es in oder in der 

35 NShe des Markerprotein-Gens realisiert. 

In einer bevorzugte Ausf tthrungsf orm der Erfindung wird die 
Inaktivierung (d.h. die Verminderung der Menge, Expression, 
Aktivitat oder Funktion) des Markerproteins durch Integration 
40 einer DNA-Sequenz in ein Markerprotein-Gen realisiert, wobei 
das Verfahren bevorzugt nachfolgende Schritte umfasst: 

i) Einbringen eines Insertionskonstruktes und mindestens eines 
Enzyms geeignet zur Induktion von DNA-Doppelstrangbruchen 
45 an einer Erkennungssequenz zur gezielten Induktion von DNA- 

Doppelstrangbruchen in oder in der Nahe des Markerprotein- 
Gens , und 
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Induktion von DNA-Doppelstrangbrtichen an den Erkennungs- 
sequenzen zur gezielten Induktion von DNA-Doppelstrang- 
brtichen in oder in der NShe des Markerprotein-Gens, und 

Insertion des Insertionskonstruktes in das Markerprotein- 
Gen, wobei die Funktionalitat des Markerprotein-Gens und 
- bevorzugt - die Funktionalitat der Erkennungssequenz zur 
gezielten Induktion von DNA-Doppelstrangbruchen inaktiviert 
wird, so dass besagte Erkennungssequenz nicht mehr durch 
das Enzym geeignet zur Induktion von DNA-Doppelstrang- 
bruchen geschnitten werden kaxm, und 

Selektion von Pflanzen oder pflanzlichen Zellen, bei denen 
das Insertionskonstrukt in das Markerproteingen insertiert 
wurde . 

Das Insertionskonstrukt umfasst - bevorzugt - die in das Genom 
zu insertierende Nukleinsauresequenz , kann aber auch separat von 
dieser eingesetzt werden. 

20 "Enzym geeignet zur Induktion von DNA-Doppelstrangbruchen an der 
Erkennungssequenz zur gezielten Induktion von DNA-Doppelstrang- 
brtichen " (infolge U DSBI-Enzym w fur "double strand-break inducing 
enzyme ") meint allgemein all solche Enzyme, die in der Lage sind, 
sequenzspezif isch Doppelstrangbruche in doppelstrangige DNA 

25 zu erzeugen. Beispielsweise, aber nicht einschrankend, sind 
zu nennen: 

1. Restriktionsendonukleasen, bevorzugt Typ II Restriktionsendo- 
nukleaseii; besonders bevorzugt Homing-Endonukleasen wie 

30 weiter unten im Detail beschrieben. 

2. Ktinstliche Nukleasen wie weiter unten im Detail beschrieben, 
wie beispielsweise chimare Nukleasen, mutierte Restriktions- 
oder Homing-Endonukleasen oder RNA-Proteinpartikel abgeleitet 

35 von mobilen Introns der Gruppe II. 

Sowohl naturliche als auch kunstlich hergestellte DSBI-Enzyme 
sind geeignet. Bevorzugt sind all solche DSBI-Enzyme, deren 
Erkennungssequenz bekannt ist und die entweder in Form ihrer 
40 Proteine (beispielsweise durch Auf reinigung) gewonnen oder unter 
Verwendung ihrer Nukleinsauresequenz exprimiert werden konnen. 

Bevorzugt wird das DSBI-Enzym unter Kenntnis seiner spezifischen 
Erkennungssequenz so ausgewahlt, dass es zusatzlich zu der Ziel- 
45 Erkennungssequenz keine weitere f unktionellen Erkennungsregionen 
im Genom der Zielpflanze besitzt. Ganz besonders bevorzugt sind 
deshalb Homing-Endonukleasen (Obersicht: Belfort M und Roberts RJ 



5 iii) 
10 

iV) 

15 
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(1997) Nucleic Acids Res 25:3379-3388; Jasin M (1996) Trends 
Genet 12:224-228; Internet: http://rebase.neb.com/rebase/rebase. 
homing . html ; Roberts RJ and Macelis D (2001) Nucl Acids Res 29: 
268-269) . Diese erfiillen aufgrund ihrer langen Erkennungs- 
5 sequenzen diese Anforderung. Die ftir derartige Homing-Endo- 
nukleasen kodierenden Sequenzen konnen beispielsweise aus dem 
Chloroplastengenom von Chlamydomonas isoliert werden (Turmel M 
et al. (1993) J Mol Biol 232:446-467). Geeignete Homing-Endo- 
nukleasen sind unter der oben angegebenen Internet-Adresse auf- 

10 gefuhrt. Zu nennen sind beispielsweise Homing-Endonukleasen wie 
F-Scel, F-Scell, F-Suvl, F-TevI, F-TevII, I-Amal, I -Anil, I-Ceul, 
I-CeuAIIP, I-Chul, I-Cmoel, I-Cpal, I-CpaII, I-Crel, I-CrepsbIP, 
1-CrepsbIIP, I-CrepsbIIIP, I-CrepsbIVP, I-Csml, I-Cvul, I-CvuAIP, 
I-Ddill, I-Dirl, I-Dmol, I-HspNIP, I-Llal, I-Msol, I-Naal, 

15 I-NanI, I-NclIP, I-NgrIP, I-NitI, I-Njal, I-Nsp23 6IP, I-PakI, 
I-PboIP, I-PcuIP, I-PcuAI, I-PcuVI, I-PgrIP, I-PobIP, I-Porl, 
1-PorIIP, I-PpbIP, I-Ppol, I-SPBetaIP, I-Scal, I-Scel, I-Scell, 
I-SceIII , I-SceIV, I-SceV, I-SceVI, I-SceVII, I-SexIP, I-SneIP, 
I-SpomCP, I-SpomIP, 1-SpomIIP, I-SquIP, I-Ssp6803I, I-SthPhiJP, 

20 I-SthPhiST3P 7 I-SthPhiS3bP, 1-TdeIP, I-TevI, I-TevII, I-TevIII, 
I-UarAP, I-UarHGPAlP, I-UarHGPAl3P, I-VinIP, I-ZbiIP, PI-MtuI, 
PI-MtuHIP, PI-MtuHIIP, PI-PfuI, Pl-PfuII, Pl-Pkol, Pl-PkoII, 
PI-PspI, PI-Rma43 812lP, PI-SPBetaIP, Pl-Scel, PI-Tful, PI-TfuII, 
PI-Thyl, PI-Tlil, PI-Tlill. Bevorzugt sind dabei die Homing- 

25 Endonukleasen, deren Gensequenzen bereits bekannt sind, wie 
beispielsweise F-Scel , I-Ceul , I-Chul , I-Dmol, I-Cpal, I-CpaII, 
I-Crel, I-Csml, F-TevI, F-TevII, I-TevI, I-TevII, I -Anil, I-Cvul, 
I-Llal, I-NanI, I-Msol, I-NitI, I-Njal, I-PakI, I-Porl, I-Ppol, 
I-Scal, I-Ssp6803l, Pl-Pkol, Pl-PkoII, PI-PspI, PI-Tful, PI-Tlil . 

30 

Ganz besonders bevorzugt sind 

I-Ceul (Cote MJ und Turmel M (1995) Curr Genet 27:177-183.; 
Gauthier A et al . (1991) Curr Genet 19:43-47; Marshall (1991) 
35 Gene 104:241-245; GenBank Acc.-No.: Z17234 Nukleotide 5102 

bis 5758) , 

I-Chul (Cote V et al.(1993) Gene 129:69-76; GenBank Acc.-No.: 
L06107, Nukleotide 419 bis 1075), 

40 

I-Cmoel (Drouin M et al. (2000) Nucl Acids Res 28:4566- 
4572) , 



45 
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- I-Cpal aus Chlamydomonas pallldostigmatlca (GenBank Acc . -No . : 
L36830, Nukleotide 357 bis 815; Turmel M et al . (1995) 
Nucleic Acids Res 23:2519-2525; Turmel, M et al. (1995) 
Mol Biol Evol 12:533-545) 

5 

I-CpaII (Turmel Met al. (1995) Mol Biol Evol 12:533-545; 
GenBank Acc. -No.: L39865, Nukleotide 719 bis 1423), 

I-Crel (Wang J et al . (1997) Nucleic Acids Res 25: 3767-3776; 
10 Durrenberger, F und Rochaix JD (1991) EMBO J 10:3495-3501; 

GenBank Acc. -No.: X01977, Nukleotide 571 bis 1062), 

I-CsmI (Ma DP et al . (1992) Plant Mol Biol 18:1001-1004) 

15 - I-NanI (Elde M et al . (1999) Eur J Biochem. 259:281-288; 
GenBank Acc. -No.: X78280, Nukleotide 418 bis 1155), 

I-NitI (GenBank Acc. -No.: X78277, Nukleotide 426 bis 1163), 

20 - I-Njal (GenBank Acc. -No.: X78279, Nukleotide 416 bis 1153), 

I-Ppol (Muscarella DE und Vogt VM (1989) Cell 56:443-454; 
Lin J und Vogt VM (1998) Mol Cell Biol 18:5809-5817; GenBank 
Acc. -No.: M38131, Nukleotide 86 bis 577), 

25 

I-Pspl (GenBank Acc. -No.: U00707, Nukleotide 1839 bis 3449), 

I-Scal (Monteilhet C et al . (2000) Nucleic Acids Res 28: 
1245-1251; GenBank Acc. -No.: X95974, Nukleotide 55 bis 465) 

30 

I-Scel (WO 96/14408; US 5,962,327 dort Seq ID NO: 1), 

Endo Seel (Kawasaki et al . (1991) J Biol Chem 2 66:5342-5347, 
identisch zu F-Scel; GenBank Acc. -No.: M63839, Nukleotide 
35 159 bis 1589) , 

I-SceII (Sarguiel B et al . (1990) Nucleic Acids Res 
18:5659-5665) , 

40 - I-SceIII (Sarguiel B et al . (1991) Mol Gen Genet. 
255:340-341) , 

I-Ssp6803I (GenBank Acc. -No.: D64003, Nukleotide 35372 bis 
35824) , 

45 
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I-TevI (Chu et al . (1990) Proc Natl Acad Sci USA 
87:3574-3578; Bell-Pedersen et al . (1990) Nucleic Acids 
Resl8:3763-3770; GenBank Acc.-No.: AF158101, Nukleotide 
144431 bis 143694) , 

5 

I-TevII (Bell-Pedersen et al . (199 0) Nucleic Acids Res 
18:3763-3770;GenBank Acc.-No.: AF158101, Nukleotide 45612 
bis 44836) , 

10 - I-TevIII (Eddy et al . (1991) Genes Dev. 5:1032-1041), 

Ganz besonders bevorzugt sind kommerziell erhaltliche Homing- 
Endonukleasen wie I-Ceul, I-Scel, I-Ppol, PI-PspI oder Pl-Scel. 
Am meisten bevorzugt sind I-Scel und I-Ppol. Wahrend das Gen 

15 kodierend fur I-Ppol in der naturlichen Form genutzt werden kann, 
besitzt das Gen kodierend fur I-Scel eine Editierstelle . Da die 
entsprechende Editierung in hoherer Pflanzen im Unterschied zu 
den Mitochondrien der Hefe nicht durchgefuhrt wird, muss eine 
kunstliche das I-Scel Protein kodierende Sequenz zur hetero- 

20 logen Expression dieses Enzyms eingesetzt werden (US 5,866/361). 

Die Enzyme konnen in der dem Fachmann gelaufigen Art und Weise 
aus ihren Herkunf tsorganismen aufgereinigt und/oder die fur sie 
kodierende Nukleinsauresequenz kloniert werden. Die Sequenzen 
25 verschiedener Enzyme sind in der GenBank hinterlegt (s.o.). 

Als kunstliche DSBI-Enzyme seien beispielhaft chimare Nukleasen 
zu nennen, die sich aus einer unspezif ischen Nukleasedomane und 
einer sequenzspezif ischen DNA-Bindungsdomane (z.B. bestehend aus 

30 Zinkfingern) zusammensetzen (Smith J et al. (2000) Nucl Acids 
Res 28(17) :3361-3369; Bibikova M et al . (2001) Mol Cell Biol. 
21:289-297). So wurde beispielsweise die katalytische Domane 
der Restriktionsendonuklease Fokl an Zinkf ingerbinde-Domanen 
fusioniert, wodurch die Spezifitat der Endonuklease definiert 

35 wurde (Chandrasegaran S & Smith J (1999) Biol Chem 380:841-848; 
Kim YG Sc Chandrasegaran S (1994) Proc Natl Acad Sci USA 
91:883-887; Kim YG et al . (1996) Proc Natl Acad Sci USA 
93:1156-1160). Auch die katalytische Domane der Ho-Endonuklease 
aus Hefe konnte bereits mit der beschriebenen Technik eine vor- 

40 definierte Spezifitat verliehen werden, indem diese an die Zink- 
fingerdomane von Transkriptionsf aktoren fusioniert wurde (Nahon E 
Sc Raveh D (1998) Nucl Acids Res 26:1233-1239). Durch geeignete 
Mutations- und Selektionsverf ahren kann man bestehende Homing- 
Endonukleasen an jede gewunschte Erkennungs sequenz anpassen. 
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Wie erwahnt, eignen sich insbesondere Zinkf ingerproteine als 
DNA-Bindungsdomane im Rahmen von chimaren Nukleasen. Diese DNA- 
bindenden Zinkf ingerdomanen konnen an jede beliebige DNA-Sequenz 
angepasst werden. Entsprechende Verfahren zur Herstellung 
5 entsprechender Zinkf ingerdomanen sind beschrieben und dem 
Fachmann bekannt (Beerli RR et al. (2000) Proc Natl Acad 
Sci 97(4) :1495-1500; Beerli RR et al.(2000) J Biol Chem 
275 (42) :32617-32627; Segal DJ and Barbas CF 3rd. (2000) Curr 
Opin Chem Biol 4(l):34-39; Kang JS and Kim JS (2000) J Biol Chem 

10 275 (12) :8742-8748; Beerli RR et al . (1998) Proc Natl Acad Sci USA 
95(25) :14628-14633; Kim JS et al . (1997) Proc Natl Acad Sci USA 
94(8) :3616-3620; Klug A (1999) J Mol Biol 293 (2 ): 215-218 ; Tsai 
SY et al. (1998) Adv Drug Deliv Rev 30(1-3) : 23-31; Mapp AK et al. 
(2000) Proc Natl Acad Sci USA 97 ( 8 ): 3930-3935 ; Sharrocks AD 

15 et al. (1997) Int J Biochem Cell Biol 29 (12 ): 1371-1387 ; Zhang L 
et al. (2000) J Biol Chem 275 (43) : 33850-33860) . Verfahren zur 
Herstellung und Selektion von Zink-Finger DNA-Bindedomanen 
mit hoher Sequenzspezif itat sind beschrieben (WO 96/06166, 
WO 98/53059, WO 98/53057) . Durch Fusion einer so erhaltenen 

20 DNA-Bindedomane an die katalytische Domane einer Endonuklease 
(wie beispielsweise der Fokl oder Ho-Endonuklease) kann man 
chimare Nukleasen mit jeder beliebigen Spezifitat herstellen, 
die als DSBI-Enzyme im Rahmen der vorliegenden Erfindung vorteil- 
haft eingesetzt werden konnen. 

25 

Kunstliche DSBI-Enzyme mit veranderter Sequenzspezif itat konnen 
auch durch Mutagenese bereits bekannter Restriktionsendonukleasen 
oder Homing Endonukleasen durch dem Fachmann gelaufige Methoden 
erzeugt werden. Insbesondere von Interesse ist neben der Muta- 

30 genese von Homing-Endonukleasen mit dem Ziel, eine veranderte 
Substratspezif itat zu erzielen, auch die Mutagenese von Matu- 
rasen. Maturasen haben haufig viele Gemeinsamkeiten mit Homing- 
Endonukleasen und lassen sich durch wenige Mutationen ggf . in 
Nukleasen umwandeln. Dies wurde beispielsweise fur die Maturase 

35 im bi2 Intron der Backerhefe gezeigt. Lediglich zwei Mutationen 
in dem die Maturase kodierenden offenen Leseraster (ORF) reichten 
aus, diesem Enzym eine Homing-Endonuklease Aktivitat zu verleihen 
(Szczepanek & Lazowska (1996) EMBO J 15:3758-3767). 

40 Weitere kunstliche Nukleasen konnen mit Hilfe mobiler Gruppe II 
Introns und den von ihnen kodierten Proteinen oder Teile dieser 
Proteine erzeugt werden. Mobile Gruppe II Introns bilden mit 
den von ihnen kodierten Proteinen RNA-Protein-Partikel , die 
sequenzspezif isch DNA erkennen und schneiden konnen. Die Sequenz- 

45 spezifitat kann dabei durch Mutagenese von bestimmten Bereichen 
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des Introns (siehe unten) den Bediirfnissen angepasst werden 
(WO 97/10362) . 

Bevorzugt wird das DSBI-Enzym als Fusionsprotein mit einer Kern- 
5 lokalisationssequenz (NLS) exprimiert. Diese NLS-Sequenz ermog- 
licht einen erleichterten Transport in den Kern und steigert die 
Effizienz des Rekombinationssystems . Verschiedene NLS-Sequenzen 
sind dem Fachmann bekannt und unter anderem beschrieben bei 
Jicks GR und Raikhel NV (1995) Annu. Rev. Cell Biol. 11:155-188. 
10 Bevorzugt fur pflanzliche Organismen ist beispielsweise die NLS- 
Sequenz des SV40 "large antigen". Ganz besonders bevorzugt sind 
die nachf olgenden NLS-Sequenzen: 

NLS1 : N-Pro-Lys-Thr-Lys-Arg-Lys-Val-C 

15 

NLS2 : N-Pro-Lys-Lys-Lys-Arg-Lys-Val-C 

Aufgrund der geringen Grofie vieler DSBI-Enzyme (wie beispiels- 
weise der Homing-Endonukleasen) ist jedoch eine NLS-Sequenz 
20 nicht zwingend erf orderlich. Diese Enzyme konnen die Kernporen 
auch ohne die Unter s tilt zung passieren. 

"Erkennungssequenz zur gezielten Induktion von DNA-Doppel- 
strangbruchen" meint allgemein solche Sequenzen, die unter 
25 den Bedingungen in der jeweils verwendeten eukaryotischen 
Zelle oder Organismus die Erkennung und Spaltung durch das 
DSBI-Enzym erlauben. Beispielhaf t aber nicht einschrankend 
seien dabei in nachf olgender Tabelle 1 die Erkennungs sequenzen 
fur die jeweiligen aufgefiihrten DSBI-Enzyme genannt . 

30 

Tabelle 1: Erkennungs s equenz en und Herkunfts organismus von DSBI- 
Enzymen (" A " gibt innerhalb einer Erkennungs s equenz 
die Schnittstelle des DSBI-Enzyms an) 



35 



40 



DSBI-Enzym 


Herkunf ts- 
organismus 


Erkennungs s equen z 


CRE 


Bacteriophage 
PI 


5 ' - AACTC TC ATCGCTTCGGATAACTTCC TGTTATC CGAAAC AT 
ATCACTCACTTTGGTGATTTCACCGTAACTGTCTATGATTAATG 
-3' 


FLP 


Saccharomyces 
cerevisiae 


5 ' - GAAGTTCCTATTCCGAAGTTCCTATTCTC TAGAAAGTA - 
TAGGAAC TTC - 3 ' 


R 


pSRl 

Plasmids 


5 ' -CGAGATC ATATC ACTGTGGAC GTTGATGAAAGAAT AC GTTA 
TTCTTTCATCAAATCGT 


P-Element 

Transpo- 

sase 


Drosophila 


5 ' -CTAGATGAAATAACATAAGGTGG 


I -Anil 


Aspergillus 
nidulans 


5 ' -TTGAGGAGGTT A TCTCTGTAAATAANITOSnS^^ 
3 ' -AACTCCTCCAAAGAGACATTTATTNNlSn^^ 



BASF Plant Science GmbH 20020471 



PF 53790 DE 






DSBI-Enzym 


Herkunf ts— 
organ ismus 


Erkennungs sequenz 




I- 


-Ddil 


uiCLyosteiium 
di s c o ideumAX3 


5' 
3' 


-TTTTTTGGTCATCCAGAAGTATAT 
- AAAAAACC AG A TAGGTC TTC ATATA 


5 


I- 


-Cvul 


tnioreiia 
vulgaris 


5' 
3' 


- CTGGGTTCAAAACGTCGTGA^ GAC AGTTTGG 

- GACCC AAGTTTTGC AG A C ACTCTGTC AAACC 




I- 


-CsmI 


Chi amydomona s 
smi thii 


5' 


- GTACTAGC ATGGGGTCAAATGTCTTTCTGG 


10 


I- 


-Cmoel 


Chi amy domo — 
nasmoewusii 


5' 
3 ' 


-TCGTAGCAGCT ^ C AC GGTT 
-AGCATCG^TCGAGTGCCAA 


I- 


-Crel 


Chlamydomonas 
reinnaruCii 


5' 
3' 


-CTGGGTTCAAAACGTCGTGA^ GAC AGTTTGG 
-GACCCAAGTTTTGCAG^CACTCTGTCAAACC - 




I- 


-Chul 


Chi amy domonas 
humicola 


5' 
3' 


-GAAGGTTTGGCACCTCG^ATGTCGGCTCATC 
-CTTCCAAACCGTG^GAGCTACAGCCGAGTAG 


15 


I- 


-Cpal 


Chlamydomonas 

pallidostig- 

mauxca 


5' 
3' 


-CGATCCTAAGGTAGCGAA^ATTCA 
- GC TAGGATTC CATC A GC TTTAAGT 




I- 


-Cpall 


Chi amydomona s 

pallidostig- 

matica 


5' 
3' 


-CCCGGCTAACTC^TGTGCCAG 
-GGGCCGAT^TGAGACACGGTC 


20 


X* 


-L.eUJL 


Chlamydomonas 
eugametos 


5' 
3' 


-CGTAACTATAAC GGTC CTAA A GGTAGCGAA 
-GC ATTGATATTGCC AG ~ GATTC C ATCGCTT 




I- 


-Dmol 


Fi^cjiil fiirnpnr'-. 

cus mobilis 


5' 
3' 


-ATGCCTTGCCGGGTAA^GTTCCGGCGCGCAT 
-TACGGAACGGCC A C ATTCAAGGCCGCGCGTA 


25 


I- 


-Seel 


S . cerevisiae 


5' 
3' 


- AGTTACGCTAGGGATAA^ CAGGGTAATATAG 
-TCAATGCGATCCC^TATTGTCCCATTATATC 
5 ' -TAGGGATAA A C AGGGTAAT 

3 ' - ATCCC A TATTGTCCC ATTA { "Core" -Sequenz ) 




I- 


-Scell 


S.cerevisiae 


5' 
3' 


-TTTTGATTCTTTGGTCACCC A TGAAGTATA 
-AAAACTAAGAAACC AG^ TGGGACTTCATAT 


30 


I- 


-Scelll 


S . cerevisiae 


5' 
3 ' 


- ATTGGAGGTTTTGGTAAC A TATTTATTAC C 

— TAACCTCC AAAAPP A ATTRATA A AT A ATfZf2 
i nn\„v« a u^nnnnuu a. x x vja x AAA X AA 1 v_r\j 


I- 


-ScelV 


S -cerevisiae 


5' 
3 ' 


-TCTTTTCTCTTGATTA^GCCCTAATCTACG 
- AGAAAAGAGAAC A TAATPttCJRATTAfiATnP 




I- 


-SceV 


S .cerevisiae 


5' 
3 ' 


-AATAATTTTCT^ TCTTAGTAATGCC 

— TTATT AAAA G AA G A ATP A TT A A P ad 1 


35 


I- 


-SceVI 


S . cerevisiae 


5' 
3 ' 


-GTTATTTAATG^TTTTAGTAGTTGG 
— CAATAAATT A P A A A A TP A TP A A A P P 




I- 


-SceVII 


S.cerevisiae 


5' 


-TGTCACATTGAGGTGCACTAGTTATTAC 




Pl-Scel 


S.cerevisiae 


5' 
3 ' 


-ATCTATGTCGGGTGC A GGAGAAAGAGGTAAT 
-TAGATACAGCC " CACGCCTCTTTCTCCATTA 


40 


F- 


-Seel 


S.cerevisiae 


5' 
3' 


-GATGCTGTAGGC A ATAGGCTTGGTT 
-CTACGAC A A TC CGTATCC GAACC AA 




F- 


-Scell 


S .cerevisiae 


5' 
3' 


-CTTTCCGCAACA^GTAAAATT 
-GAAAGGCG A TTGTCATTTTAA 


45 


I- 


-Hmul 


Bacillus sub- 
tilis bacte- 
riophage SPOl 


5' 
3 ' 


-AGTAATGAGCCTAACGCTCAGCAA 
— TC ATTACTCGGATTGC A GAGTCGTT 


I- 


-HmuII 


Bacillus 

subtilis 

bac t er i ophage 

SP82 


5 ' -AGTAATGAGCCTAACGCTCAACAAN]^ 
NISINNN^^ 
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DSBI-Enzym 


Herkunf ts- 
organismus 


Erkennungssequenz 




I-Llal 


Lactococcus 
lactis 


5' 
3' 


-CACATCC ATAAC ~CATATCATTTTT 
-GTGTAGGTATTGGTATAGTAA^AAA 


5 


I-Msol 


Monomastix 
species 


5' 
3' 


-CTGGGTTCAAAACGTCGTGA^GACAGTTTGG 

- GACCCAAGTTTTGC AG A C ACTCTGTC AAACC ; 




I -Nan I 


Naegleria an- 
dersoni 


5' 
3 ' 


-AAGTCTGGTGCCA A GCACCCGC 
-TTCAGACC A ACGGTCGTGGGCG 


10 


I-NitI 


Naegleria 
italica 


5' 
3' 


-AAGTCTGGTGCCAAGCACCCGC 
-TTCAGACC A ACGGTCGTGGGCG 


I-Njal 


Naegleria ja- 
miesoni 


5' 
3' 


-AAGTCTGGTGCCAAGCACCCGC 
-TTCAGACC A ACGGTCGTGGGCG 




I-PakI 


Pseudendoclo- 
nium akinetum 


5' 
3' 


- C TGGGTTC AAAACGTC GTGA A GAC AGTTTGG 
-GACCCAAGTTTTGCAG A CACTCTGTCAAACC 


15 


I-Porl 


Pyrobaculum 
or gano t r ophum 


5' 
3' 


- GCGAGCCC GTAAGGGT A GTGTACGGG 
-CGCTCGGGC ATT A CCC ACACATGCCC 




I-Ppol 


Physarum po- 
lycephalum 


5' 
3' 


-TAACTATGACTC TCTTAA * GGTAGC C AAAT 
-ATTGATACTGAGAG A AATTCCATCGGTTTA 




I-Scal 


Sac char omyces 
capensis 


5' 
3' 


- TGTC AC ATTGAGGTGC ACT A AGTTATT AC 
— ACAGTGTAACTCCAC A GTGATC AATAATG 


20 


I-Ssp6803I 


Synechocystis 
species 


5' 
3' 


— GTCGGGCT A CATAACCCGAA 
-CAGC^CGAGTA A TTGGGCTT 




Pl-Pful 


Pyrococcus 
furiosus Vcl 


5' 
3' 


-GAAGATGGGAGGAGGG A ACCGGAC TC AAC TT 
-CTTCTACCCTCC A TCCCTGGCCTGAGTTGAA 




Pl-PfuII 


Pyrococcus 
furiosus Vcl 


5' 
3 ' 


— ACGAATCC ATGTGGAGA A AGAGCC TCTAT A 
— TGCTTAGGTACAC A CTCTTCTCGGAGATAT 


25 


Pl-Pkol 


Pyrococcus 
kodakar aens i s 
K0D1 


5' 
3' 


— GATTTTAGAT A CCCTGTACC 
-CTAAAA ^ TCTAGGGACATGG 




Pl-PkoII 


Pyrococcus 
kodakar aens i s 

KUJJJL 


5' 
3' 


— C AGTAC TAC G A GTTAC 
-GTCATG A ATGCCAATG 


30 


PI-PspI 


Pyrococcus 
sp. 


5' 
3' 


- AAAATCCTGGC AAAC AGCTATTAT A GGGTAT 
-TTTTAGGACCGTTTGTCGAT A AATACC C ATA 




PI-Tful 


Thermococcus 

fumicolans 

ST557 


5 ' 
3' 


-TAGATTTT AGGT A CGC TATATCCTTCC 
- ATCTAAAA A TCCAGCGATATAGGAAGG 


35 


PI-TfuII 


Thermococcus 
fumicolans 


5' 
3 ' 


- TAYGCNGAYACN A GACGGYTTYT 
— ATRCGNC T A RTGNC TGCCTi A AR A 




PI-Thyl 


Thermococcus 
hydro therma- 
lis 


5 ' 
3' 


— TAYGCMG A Y APN^ fiAPfiCIYTTVT 
- ATRCGNCT ^ RTGNCTGC CRAARA 


40 


n T ml A T 
tfX— I 111 


Thermococcus 
litoralis 


5 ' 
3' 


-TAYGCNGAYACNGACGG A YTTYT 
- AT RC GNCTRTGNC A TGC CRAARA 




PT— Tl i TT 

IT J- X JL X X JL 


j. iiexiuococcus 
litoralis 


5' 


— AAATTGC TTGC AAAC AGCTATTACGGCT AT 




I-TevI 


Bacteriophage 
T4 


5' 
3' 


-AGTGGTATCAAC A GCTCAGTAGATG 
-TC ACC ATAGT A TGC GAGTC ATCTAC 


45 


I-TevII 


Bacteriophage 
T4 


5' 
3' 


-GCTTATGAGTATGAAGTGAAC ACGT ^TATTC 
-CGAATACTC ATAC TTC ACTTGTG A C AATAAG 
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DSBI-Enzym 


Herkunf ts— 
organismus 


Erkennungs sequenz 


F-TevI 


Bacteriophage 
T4 


5 ' - GAAAC AC AAGA^ AATGTTTAGTAAANN^ 
3 ' -CTTTGTGTTCTTTACAAATCATTTNlSnSfN^ 


F-TevII 


Bacteriophage 
T4 


5 ' -TTTAATCCTCGCTTC ^ AGATATGGCAACTG 
3 ' -AAATTAGGAGCGA^AGTCTATACCGTTGAC 



Dabei sind auch kleinere Abweichungen (Degenerationen) der 
Erkennungs sequenz umfasst, die dennoch eine Erkennung und 

10 Spaltung durch das jeweilige DSBI-Enzym ermoglichen. Derartige 
Abweichungen - auch in Zusammenhang mit unterschiedlichen 
Rahmenbedingungen wie beispielsweise Calcium oder Magnesium- 
Konzentration - sind beschrieben (Argast GM et al . (1998) J Mol 
Biol 280:345-353). Ferner sind Kernsequenzen ( "Core "-Sequenzen) 

15 dieser Erkennungs sequenz en umfasst. Es ist bekannt, dass auch die 
inneren Anteile der Erkennungs sequenz en fur einen induzierten 
Doppelstrangbruch geniigen und das die auEeren nicht unbedingt 
relevant sind, jedoch die Effizienz der Spaltung mitbestimmen 
konnen. So kann beispielsweise fur I-Scel eine 

20 18bp-"Core"-Sequenz definiert werden. 

Besagte DSBI -Erkennungs sequenz en konnen an verschiedenen 
Positionen in oder in der Nahe eines Markerprotein-Gens lokali- 
siert werden und konnen - beispielsweise bei der Verwendung eines 
25 Transgens als Markerproteins - bereits bei der Konstruktion der 
Markerprotein-Expressionskassette eingebaut werden. Verschiedene 
Moglichkeiten der Lokalisation sind beispielhaft in den Fig. 2 -A, 
2-B, 3 und 5 sowie in den Beschreibungen dazu verdeutlicht . 

30 In einer weiteren vorteilhaf ten Ausfiihrungsf orm umfasst die 

Insertionssequenz mindestens eine Homologiesequenz A, die eine 
ausreichende Lange und eine ausreichende Homologie zu einer 
Sequenz A' in dem Markerproteingen aufweist, um eine homologe 
Rekombination zwischen A und A' zu gewahrleisten . Bevorzugt 

35 ist Insertionssequenz von zwei Sequenzen A und B flankiert, die 
eine ausreichende Lange und eine ausreichende Homologie zu einer 
Sequenz A' bzw. B' in dem Markerproteingen aufweisen, um eine 
homologe Rekombination zwischen A und A' bzw. B und B' zu gewahr- 
leisten. 

40 

"Ausreichende Lange" meint in Bezug auf die Homologiesequenzen A, 
A' und B, B' bevorzugt Sequenzen von einer Lange von mindestens 
100 Basenpaaren, bevorzugt mindestens 250 Basenpaaren, besonders 
bevorzugt von mindestens 500 Basenpaaren, ganz besonders bevor- 
45 zugt von mindestens 1000 Basenpaaren, am meistens bevorzugt von 
mindestens 2500 Basenpaaren. 



BASF Plant Science GmbH 20020471 



PF 53790 DE 




"Ausreichende Homologie" meint in Bezug auf die Homologie- 
sequenzen, bevorzugt Sequenzen die eine Homologie zueinander 
aufweisen von mindestens 70 %, bevorzugt 80 %, vorzugsweise min- 
destens 90 %, besonders bevorzugt mindestens 95 %, ganz besonders 
5 bevorzugt mindestens 99 %, am meisten bevorzugt 100% uber eine 
Lange von von mindestens 2 0 Basenpaaren, bevorzugt mindestens 
50 Basenpaaren, besonders bevorzugt von mindestens 100 Basen- 
paaren, ganz besonders bevorzugt von mindestens 250 Basenpaaren, 
am meisten bevorzugt von mindestens 500 Basenpaaren. 

10 

Unter Homologie zwischen zwei Nukleinsauren wird die Identit&t 
der Nukleinsauresequenz uber die jeweils gesamte Sequenzlange 
verstanden, die durch Vergleich mit Hilfe des Programmalgorithmus 
GAP (Wisconsin Package Version 10.0, University of Wisconsin, 
15 Genetics Computer Group (GCG) , Madison, USA) unter Einstellung 
folgender Parameter berechnet wird: 

Gap Weight: 12 Length Weight: 4 

20 Average Match: 2,912 Average Mismatch: -2 , 003 

In einer weiteren bevorzugten Ausfuhrungsf orm wird die Effizienz 
der Rekombination gesteigert durch Kombination mit Verfahren, 
die die homologe Rekombination fordern. Solche Verfahren sind be- 

25 schrieben und umfassen beispielhaft die Expression von Proteinen 
wie RecA oder die Behandlung mit PARP-Inhibitoren . Es konnte 
gezeigt werden, dass die intrachromosomale homologe Rekombination 
in Tabakpf lanzen durch die Verwendung von PARP-Inhibitoren erhoht 
werden kann (Puchta H et al . (1995) Plant J 7:203-210). Durch 

30 den Einsatz dieser Inhibitoren kann die Rate der homologen 

Rekombination in den Rekombinationskonstrukten nach Induktion 
des sequenzspezif ischen DNA-Doppelstrangbruches und damit die 
Effizienz der Deletion der Tr ansgens equenz en weiter erhoht 
werden. Verschiedene PARP Inhibitoren konnen dabei zum Einsatz 

35 kommen. Bevorzugt umfasst sind Inhibitoren wie 3-Aminobenzamid, 
8-Hydroxy-2-methylc[uinazolin-4-on (NU1025) , 1 , llb-Dihydro- 
[2H]benzopyrano[4,3,2-de]isoquinolin-3-on (GPI 6150), 5-Amino- 
isoquinolinon, 3 , 4-Dihydro-5- [4- (l-piperidinyl)butoxy] -1 (2H) - 
isoquinolinon oder die in WO 00/26192, WO 00/29384, WO 00/32579, 

40 WO 00/64878, WO 00/68206, WO 00/67734, WO 01/23386 und 
WO 01/23390 beschriebenen Substanzen. 

Weitere geeignete Methoden sind die Einfuhrung von Nonsense- 
Mutationen in endogene Markerprotein Gene zum Beispiel mittels 
45 Einfuhrung von RNA/DNA-Oligonukleotiden in die Pflanze (Zhu 
et al. (2000) Nat Biotechnol 18 (5) : 555-558) . Punktmutationen 
konnen auch mittels DNA-RNA Hybriden erzeugt werden, die auch 
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als *chimeraplasty" bekannt sind (Cole-Strauss et al . (1999) Nucl 
Acids Res 27 (5) :1323-1330; Kmiec (1999) Gene therapy American 
Scientist 87 (3) :240-247) . 

5 Die Methoden der dsRNAi, der Kosuppression mittels sense-RNA 
und der "VIGS" ("virus induced gene silencing") werden auch als 
*post-transcriptional gene silencing" (PTGS) bezeichnet. PTGS- 
Verfahren sind besonders vorteilhaft, weil die Anforderungen an 
die Homologie zwischen dem zu vermindernden Markerprotein-Gen und 

10 der transgen exprimierten sense- oder dsRNA-Nukleinsauresequenz 
geringer sind als beispielsweise bei einem klassischen antisense- 
Ansatz . So kann man unter Verwendung der Markerprotein-Nuklein- 
sauresequenzen aus einer Art auch die Expression von homologen 
Markerprotein-Proteinen in anderen Arten effektiv vermindern, 

15 ohne, dass die Isolierung und Strukturauf klarung der dort vor- 
kommenden Markerprotein-Homologen zwingend erforderlich ware. 
Dies erleichtert erheblich den Arbeitsaufwand. 

"Einbringen" umfasst im Rahmen der Erfindung alle Verfahren, die 
20 dazu geeignet eine w antiHYEarkerprotein"-Verbindung, direkt oder 

indirekt, in eine Pflanze oder eine Zelle, Kompartiment , Gewebe, 

Organ oder Samen derselben einzufuhren oder dort zu generieren. 

Direkte und indirekte Verfahren sind umfasst. Das Einbringen 

kann zu einer vorubergehenden ( transienten) Prasenz einer 
25 "anti-Markerprotein''-Verbindung (beispielsweise einer dsRNA 

oder einer Rekombinase) fuhren oder aber auch zu einer dauer- 

haften (stabilen) . 

GemaS der unterschiedlichen Natur der oben beschriebenen Ansatze 
30 kann die "anti-Markerprotein''--Verbindung ihre Funktion direkt 

(zum Beispiel durch Insertion in ein endogenes Markerprotein Gen) 
ausuben. Die Funktion kann aber auch indirekt nach Transkription 
in eine RNA (zum Beispiel bei antisense Ansatzen) oder nach 
Transkription und Translation in ein Protein (zum Beispiel bei 
35 Rekombinasen oder DSBI-Enzymen) ausgeubt werden. Sowohl direkte 
als auch indirekt wirkende u anti-Markerprotein"-Verbindungen 
sind erf indungsgema£ umfasst. 

Einfuhren umfasst beispielsweise Verfahren wie Transf ektion, 
40 Transduktion oder Transformation. 

"Anti-Markerprotein" Verbindungen umfasst somit beispiels- 
weise auch Expressionskassetten, die eine Expression (d.h. 
Transkription und ggf . Translation) beispielsweise einer 
45 MP-dsRNA, einer MP-antisenseRNA, einer sequenzspezif ischen 
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Rekombinase oder eines DSBI-Enzyms in einer pflanzlichen Zelle 
realisieren konnen. 

"Expressionskassette" meint im Rahmen dieser Erfindung allgemein 
5 solche Konstruktionen in denen eine zu exprimierende Nuklein- 
sauresequenz in f unktioneller Verknupfung mit mindestens einer 
genetischen Kontrollsequenz - bevorzugt einer Promotorsequenz - 
steht. Expressionskassetten bestehen bevorzugt aus doppel- 
strangiger DNA und konnen eine lineare oder zirkulare Struktur 
10 haben. 



Unter einer f unktionellen Verknupfung versteht man zum Bei- 
spiel die sequentielle Anordnung eines Promotors mit einer zu 
transkribierenden Nukleinsauresequenz (beispielsweise kodierend 

15 fur eines MP— dsRNA oder ein DSBI-Enzym) und ggf . weiterer regu- 
lativer Elemente wie zum Beispiel einem Terminator und/oder Poly- 
adenylierungssignalen derart, dass jedes der regulativen Elemente 
seine Funktion bei der Transkription der Nukleinsauresequenz, je 
nach Anordnung der Nukleinsauresequenzen erfullen kann. Funktion 

20 kann dabei beispielsweise die Kontrolle der Expression d.h. 

Transkription und/oder Translation der Nukleinsauresequenz (bei- 
spielsweise kodierend fur eine MP-dsRNA oder ein DSBI-Enzym) 
bedeuten. Kontrolle umfasst dabei beispielsweise das Initiieren, 
Steigerung, Steuerung oder Suppression der Expression d.h. Tran- 

25 skription und ggf. Translation. Dazu ist nicht unbedingt eine 
direkte Verknupfung im chemischen Sinne erf orderlich. Genetische 
Kontrollsequenzen, wie zum Beispiel Enhancer-Sequenzen, konnen 
ihre Funktion auch von weiter entfernten Positionen oder gar von 
anderen DNA-Molekxilen aus auf die Zielsequenz ausuben. Bevorzugt 

30 sind Anordnungen, in denen die zu transkribierende Nukleinsaure- 
sequenz hinter der als Promoter fungierenden Sequenz positioniert 
wird, so dass beide Sequenz en kovalent miteinander verbunden 
sind. Bevorzugt ist dabei der Abstand zwischen der Promotorse- 
quenz und der transgen zu exprimierende Nukleinsauresequenz 

35 geringer als 200 Basenpaare, besonders bevorzugt kleiner als 
100 Basenpaare, ganz besonders bevorzugt kleiner als 50 Basen- 
paare . 



Dem Fachmann sind verschiedene Wege bekannt, um zu einer der 
40 erfindungsgemassen Expressionskassette zu gelangen. Die Her- 
stellung einer erfindungsgemassen Expressionskassette erfolgt 
beispielsweise bevorzugt durch direkte Fusion einer als Promoter 
fungierenden Nukleinsauresequenz mit einer zu exprimierenden 
Nukleotidsequenz (beispielsweise kodierend fur eines MP-dsRNA 
45 oder ein DSBI-Enzym) . Die Herstellung einer funktionellen Ver- 
kniipfung kann mittels gangiger Rekombinations- und Klonierungs- 
techniken realisiert werden, wie sie beispielsweise in Maniatis 
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T, Fritsch EF und Sambrook J (1989) Molecular Cloning: A Labora- 
tory Manual, Cold Spring Harbor Laboratory, Cold Spring Harbor, 
NY sowie in Silhavy TJ et al . (1984) Experiments with Gene 
Fusions, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY 
5 und in Ausubel FM et al. (1987) Current Protocols in Molecular 
Biology, Greene Publishing Assoc. and Wiley Interscience 
beschrieben sind. 



Vorzugsweise umfassen die erf indungsgemassen Expressionskassetten 
10 5'-stromaufwarts von der jeweiligen transgen zu exprimierenden 
Nukleinsauresequenz einen Promotor und 3 ' -stromabwarts eine Ter- 
minatorseguenz als zusatzliche genetische Kontrollsequenz, sowie 
gegebenenfalls weitere ubliche regulative Elemente, und zwar 
jeweils funktionell verknupft mit der transgen zu exprimierenden 
15 Nukleinsauresequenz . 

Der Begriff der "genetischen Kontrollsequenzen" ist breit zu 
verstehen und meint all solche Sequenzen, die einen Einfluss 
auf das Zustandekommen oder die Funktion der erf indungsgemassen 

20 Expressionskassette haben. Genetische Kontrollsequenzen gewahr- 
leisten zum Beispiel die Transkription und gegebenenfalls 
Translation in prokaryotischen oder eukaryotischen Organismen. 
Genetische Kontrollsequenzen sind beispielsweise beschrieben bei 
"Goeddel; Gene Expression Technology: Methods in Enzymology 185, 

25 Academic Press, San Diego, CA (1990)" oder "Gruber and Crosby, 
in: Methods in Plant Molecular Biology and Biotechnolgy, CRC 
Press, Boca Raton, Florida, eds. :Glick and Thompson, Chapter 7, 
89-108" sowie den dort aufgewiesenen Zitaten. 

30 Genetische Kontrollsequenzen umfassen insbesondere in Pflanzen 
funktionelle Promotoren. Als bevorzugte Promotoren fur die 
Expressionskassetten ist grundsatzlich jeder Promotor geeignet, 
der die Expression von Genen, insbesondere Fremdgenen, in 
Pflanzen steuern kann. 

35 

Pflanzenspezifische oder in Pflanzen bzw. pflanzlichen Zelle 
funktionelle Promotoren meint grundsatzlich jeden Promotor, der 
die Expression von Genen, insbesondere Fremdgenen, in mindestens 
einer Pflanze oder einem Pf lanzenteil , -zelle, -gewebe, -kultur 
40 steuern kann. Dabei kann die Expression beispielsweise konstitu- 
tiv, induzierbar oder entwicklungsabhangig sein. Bevorzugt sind: 

a) Konstitutive Promotoren 

45 "Konstitutive" Promotoren meint solche Promotoren, die eine 

Expression in zahlreichen, bevorzugt alien, Geweben uber 
einen grdSeren Zeitraum der Pf lanzenentwicklung, bevorzugt 
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zu alien Zeitpunkten der Pf lanzenentwicklung, gewahrleisten 
(Benfey et al.(1989) EMBO J 8:2195-2202). Vorzugsweise 
verwendet man insbesondere einen pflanzlichen Promotor oder 
einen Promotor, der einem Pf lanzenvirus entstammt. Ins- 
besondere bevorzugt ist der Promotor des 3 5S-Transkriptes 
des CaMV Blumenkohlmosaikvirus (Franck et al . (1980) Cell 
21:285-294; Odell et al. (1985) Nature 313:810-812; Shewmaker 
et al. (1985) Virology 140:281-288; Gardner et al . (1986) 
Plant Mol Biol 6:221- 228) oder der 19S CaMV Promotor 
(US 5,352,605; WO 84/02913; Benfey et al . (1989) EMBO J 
8:2195-2202) sowie der Promotor des Nitrilase-1 Gens aus 
Arabidopsis thaliana (GenBank Acc . -No . : U38846, Nukleotide 
3862 bis 5325 oder alternativ 5342) . 

Ein weiterer geeigneter konstitutiver Promotor ist der 
"Rubisco small subunit (SSU) "-Promotor (US 4,962,028), der 
LeguminB-Promotor (GenBank Acc . -No . : X03 677) , der Promotor 
der Nopal insynthase aus Agrobacterium, der TR-Doppelpromotor , 
der OCS (Octopin Synthase) Promotor aus Agrobacterium, der 
Ubiquitin Promotor (HoltorfevS et al . (1995) Plant Mol Biol 
29:637-649), der Ubiquitin 1 Promotor (Christensen et al . 
(1992) Plant Mol Biol 18:675-689; Bruce et al . (1989) Proc 
Natl Acad Sci USA 86:9692-9696), der Smas Promotor, der 
Cinnamylalkoholdehydrogenase-Promotor (US 5, 683 , 439) , 
die Promotoren der vakuolarer ATPase Untereinheiten oder 
der Promotor eines prolinreichen Proteins aus Weizen 
(WO 91/13991) , sowie weitere Promotoren von Genen, deren 
konstitutive Expression in Pflanzen dem Fachmann bekannt ist. 

b) Gewebespezif ische Promotoren 

Bevorzugt sind Promotoren mit Spezifitaten fur die Antheren, 
Ovarien, Bluten, Blatter, Stengel, Wurzeln oder Samen. 

Samenspezif ische Promotoren umfassen zum Beispiel den 
Promotor des Phaseolins (US 5,504,2 00; Bustos MM et al . 
(1989) Plant Cell 1 (9) : 839-53 ) , des 2S Albumins (Joseff- 
son LG et al . (1987) J Biol Chem 262:12196-12201), des 
Legumins (Shirsat A et al . (1989) Mol Gen Genet 215(2): 
326-331), des USP (unknown seed protein; Baumlein H 
et al. (1991) Mol Gen Genet 225 (3 ): 459-67) , des Napins 
(US 5,608,152; Stalberg K et al . (1996) L Planta 
199:515-519), des Saccharosebindeproteins (WO 00/26388), 
des Legumins B4 (LeB4; Baumlein H et al. (1991) Mol Gen 
Genet 225: 121-128; Baeumlein et al . (1992) Plant Journal 
2 (2):233-9; Fiedler U et al . (1995) Biotechnology (NY) 
13 (10) :1090f ) , des Oleosins (WO 98/45461) oder des Bce4 
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(WO 91/13980) . Weitere geeignete samenspezif ische 
Promotoren sind die der Gene kodierend fur das "High 
Molecular Weight Glutenin" (HMWG) , Gliadin, Verzweigungs- 
enzym, ADP Glucose Pyrophosphatase (AGPase) oder Starke- 
5 synthase. Bevorzugt sind ferner Promotoren, die eine 

samenspezif ische Expression in Monokotyledonen wie Mais, 
Gerste, Weizen, Roggen, Reis etc. erlauben. Vorteilhaft 
eingesetzt werden konnen der Promoter des lpt2- oder 
lptl-Gens (WO 95/15389, WO 95/23230) oder die Promotoren 
10 beschrieben in WO 99/16890 (Promotoren des Hordeins, 

Glutelins, Oryzins, Prolamins, Gliadins, Zeins, Kasirins 
oder Secalins) . Weitere samenspezif ische Promotoren sind 
beschrieben in WO 89/03887. 



15 Knollen-, Speicherwurzel- oder Wurzel-spezif ische Promo- 

toren umfassen beispielsweise den Patatin Promotor Klasse 
I (B33) oder den Promotor des Cathepsin D Inhibitors aus 
Kartof f el . 



20 Blattspezif ische Promotoren umfassen beispielsweise 

den Promotor der cytosolischen FBPase aus Kartoffel 
(WO 97/05900), den SSU Promotor (small subunit) der 
Rubisco (Ribulose-1, 5-bisphosphatcarboxylase) oder den 
ST-LSI Promotor aus Kartoffel (Stockhaus et al. (1989) 

25 EMBO J 8:2445-2451). 

Blutenspezif ische Promotoren umfassen beispielsweise den 
Phytoen Synthase Promotor (WO 92/16635) oder den Promotor 
des P-rr Gens (WO 98/22593) . 



30 



Antheren-spezif ische Promotoren umfassen beispielsweise 
den 5126-Promotor (US 5,689,049, US 5,689,051), den 
glob-1 Promotor und den y-Zein Promotor. 



35 c) Chemisch induzierbare Promotoren 



Chemisch induzierbare Promotor erlauben es, die Expression 
abhangig von einem exogenen Stimulus zu steuern (Ubersichts- 
artikel: Gatz et al . (1997) Ann Rev Plant Physiol Plant 

40 Mol Biol 48:89-108). Beispielhaft seien zu nennen: Der PRP1 

Promotor (Ward et al . (1993) Plant Mol Biol 22:361-366), 
ein durch Salicylsaure induzierbarer Promotor (WO 95/19443) , 
ein durch Benzolsulf onamid-induzierbarer Promotor 
(EP-A 0 388 186) , ein durch Tetrazyklin-induzierbarer 

45 Promotor (Gatz et al . (1992) Plant J 2:397-404), ein durch 

Abscisinsaure induzierbarer Promotor (EP 0 335 528) bzw. 
ein durch Ethanol- oder Cyclohexanon-induzierbarer Promotor 
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(WO 93/21334) . Ferner geeignet ist der Promotor des Gluta- 
thione^- transferase Isoform II Gens (GST-II-27), der 
durch exogen applizierte Safener wie z.B. N,N-Diallyl- 
2,2-dichloroacetamid aktiviert werden kann (WO 93/01294) 
5 und in zahlreichen Geweben von sowohl Monokotyledonen als 

auch Dikotyledonen funktionell ist. 

Besonders bevorzugt sind konstitutive oder induzierbare 
Promotoren . 

10 

Ferner sind ftir die gezielte Expression in den Plastiden 
plastiden-spezifische Promotoren bevorzugt. Geeignete Promotoren 
sind beispielsweise beschrieben in WO 98/55595 oder WO 97/06250. 
Zu nennen sind das rpo B Promo tor element, das atoB Promotor- 
15 element, das clpP Promotorelement (siehe auch WO 99/46394) oder 
das 16SrDNA Promotorelement. Weiterhin sind virale Promotoren 
geeignet (WO 95/16783). 

Eine gezielte plastidare Expression kann auch erreicht werden, 
20 wenn man zum Beispiel einen bakteriellen oder Bakteriophagen 
Promotor verwendet, die resultierende Expressionskassette in 
die plastidare DNA einbringt und die Expression dann durch ein 
Fusionsprotein aus einer bakteriellen oder Bakteriophagen Poly- 
merase und einern plastidaren Trans itpept id exprimiert. Ein ent- 
25 sprechendes Verfahren ist in US 5,925,806 beschrieben. 

Genetische Kontrollsequenzen umfassen ferner auch die 5 ' -untrans- 
latierte Regionen, Introns oder nichtkodierende 3 '-Region von 
Genen wie beispielsweise das Actin-1 Intron, oder die Adhl-S 

30 Introns 1, 2 und 6 (allgemein: The Maize Handbook, Chapter 116, 
Freeling and Walbot, Eds., Springer, New York (1994)). Es ist 
gezeigt worden, dass diese eine signifikante Funktionen bei der 
Regulation der Genexpression spielen konnen. So wurde gezeigt, 
dass 5'-untranslatierte Sequenzen die transiente Expression 

35 heterologer Gene verstarken konnen. Sie konnen ferner die Gewebs- 
spezifitat fordern (Rouster J et al.(1998) Plant J. 15:435-440). 
Beispielhaft fur Trans lationsverstarker sei die 5 ' -Leadersequenz 
aus dem Tabak-Mosaik-Virus zu nennen (Gallie et al . (1987) Nucl 
Acids Res 15:8693-8711). 

40 

Als Kontrollsequenzen geeignete Polyadenylierungssignale sind 
insbesondere Polyadenylierungssignale pflanzlicher Gene sowie 
T-DNA Polyadenylierungssignale aus Agrobacterium tumefaciens. 
Beispiele fur besonders geeignete Terminatorsequenzen sind 
45 der OCS ( Oct opin- Synthase) -Terminator und der NOS (Nopalin- 

Synthase) -Terminator (Depicker A et al (1982) J Mol Appl Genet 
1:561-573), als auch die Terminatoren von Sojabohnen Actin, 



BASF Plant Science GmbH 20020471 



PF 53790 DE 




RUBISCO oder alpha-Amylase aus Weizen (Baulcombe DC et al (1987) 
Mol Gen Genet 209:33-40). 

Die Expressionskassette kann vorteilhaf terweise eine oder mehrere 
5 sogenannte "enhancer Sequenzen" funktionell verknupft mit dem 
Promoter enthalten, die eine erhohte transgene Expression der 
Nukleinsauresequenz ermoglichen . 

Genetische Kontrollsequenzen meint ferner Sequenzen, die fur 

10 Fusionsproteine bestehend aus einer Signalpeptidsequenz kodieren. 
Die Expression eines Zielgenes ist in jedem gewiinschten Zell- 
kompartiment, wie z.B. dem Endomembransystem, der Vakuole und 
den Chloroplasten moglich. Durch Nutzung des sekretorischen Weges 
sind gewunschte Glykosylierungsreaktionen, besondere Faltungen 

15 u.a. moglich. Auch die Sekretion des Zielproteins zur Zellober- 
flache bzw. die Sezernierung ins Kulturmedium, beispielsweise 
bei Nutzung suspensionskultivierter Zellen oder Protoplasten ist 
moglich. Die dafur notwendigen Targetsequenzen konnen sowohl in 
einzelnen Vektorvariationen beriicksichtigt werden als auch durch 

20 Verwendung einer geeigneten Klonierungsstrategie gemeinsam mit 
dem zu klonierenden Zielgen in den Vektor mit eingebracht werden. 
Als Targetsequenzen konnen sowohl Gen-eigene, sofern vorhanden, 
oder heterologe Sequenzen genutzt werden. Zusatzliche, hetero- 
loge zur funktionellen Verknupfung bevorzugte aber nicht darauf 

25 beschrankte Sequenzen sind weitere Targeting-Sequenzen zur 
Gewahrleistung der subzellularen Lokalisation im Apoplasten, 
in der Vakuole, in Plastiden, im Mitochondrium, im Endoplas- 
matischen Retikulum (ER) , im Zellkern, in Olkorperchen oder 
anderen Kompartimenten; sowie Translationsverstarker wie die 

30 5'-Leadersequenz aus dem Tabak-Mosaik-Virus (Gallie et al. (1987) 
Nucl Acids Res 15: 8693-8711) und dergleichen. Das Verfahren, 
an sich nicht in den Plastiden lokalisierte Proteine, gezielt 
in die Plastiden zu transportieren ist beschrieben (Klosgen RB 
und Weil JH (1991) Mol Gen Genet 225 (2) : 297-304; Van Breusegem 
35 F et al. (1998) Plant Mol Biol 38 (3 ): 491-496) . 

Als Kontrollsequenzen sind weiterhin solche zu verstehen, die 
eine homologe Rekombination bzw. Insertion in das Genom eines 
Wirtsorganismus ermoglichen oder die Entfernung aus dem Genom 

40 erlauben. Methoden wie die cre/lox-Technologie erlauben eine 
gewebsspezifische, unter Umstanden induzierbare Entfernung der 
Expressionskassette aus dem Genom des Wirtsorganismus (Sauer B. 
Methods. 1998; 14 (4 ) : 381-92 ) . Hier werden bestimmte flankierende 
Sequenzen dem Zielgen angeftigt (lox-Sequenzen) , die spater eine 

45 Entfernung mittels der cre-Rekombinase ermoglichen. 
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Bevorzugt kann die Expressionskassette, bestehend aus einer 
Verknupfung von Promoter und zu transkribierender Nukleinsaure- 
sequenz, integriert in einem Vektor vorliegen und durch zum Bei- 
spiel Transformation - nach einem der unten beschriebenen Ver- 
5 fahren - in die pflanzliche Zelle oder Organismus eingebracht 
werden . 

"Transgen* meint bevorzugt - beispielsweise in Bezug auf eine 
transgene Expressionskassette, einen transgenen Expressions - 
10 vektor, einen transgenen Organismus oder Verfahren zur transgenen 
Expression von Nukleinsauren - alle solche durch gentechnische 
Methoden zustande gekommene Konstruktionen oder Verfahren unter 
Verwendung derselben, in denen entweder 

15 a) die zu exprimierende Nukleinsauresequenz , oder 

b) der mit der zu exprimierenden Nukleinsauresequenz gema£ a) 
funktionell verknupfte Promotor, oder 

20 c) (a) und (b) 

sich nicht in ihrer natiirlichen, genetischen Umgebung (d.h. an 
ihrem natiirlichen chromosomal en Locus) befinden oder durch gen- 
technische Methoden modifiziert wurden, wobei die Modifikation 
25 beispielhaft eine Substitution, Addition, Deletion, Inversion 
oder Insertion eines oder mehrerer Nukleotidreste sein kann. 
Naturliche genetische Umgebung meint den natiirlichen chromo- 
somalen Locus in dem Herkunf tsorganismus oder das Vorliegen 
in einer genomischen Bibliothek, 

30 

"Transgen" meint in Bezug auf eine Expression ( " transgene 
Expression") bevorzugt all solche unter Einsatz einer transgenen 
Expressionskassette, transgenen Express ions vektor oder transgenen 
Organismus - entsprechend dem oben gegebenen Definitionen - 
35 realisierten Expressionen. 

Die im Rahmen des erf indungsgemassen Verfahren zum Einsatz 
kommenden DNA-Konstrukte und die von ihnen abgeleiteten 
Vektoren konnen weitere Funktionselemente enthalten. Der 
40 Begriff Funktionselement ist breit zu verstehen und meint all 
solche Elemente, die einen Einfluss auf Herstellung, Vermehrung 
oder Funktion der DNA-Konstrukte oder von diesen abgeleitete 
Vektoren oder Organismen haben. Beispielhaft aber nicht ein- 
schrankend seien zu nennen : 

45 
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1 . Selektionsmarker 

Selektionsmarker umfassen beispielsweise solche Nukleinsaure- 
oder Proteinsequenzen, deren Expression einer Zelle, Gewebe oder 
5 Organismus einen Vorteil (positiver Selektionsmarker) oder Nach- 
teil (negativer Selektionsmarker) gegemiber Zellen vermittelt, 
die diese Nukleinsaure oder Protein nicht exprimieren. Positive 
Selektionsmarker wirken beispielsweise dadurch, dass eine auf 
die Zelle inhibitorisch wirkende Substanz detoxif iziert wird 

10 (Bsp. Antibiotika-VHerbizidresistenz) , oder eine Substanz 

gebildet wird, welche der Pflanze unter den gewahlten Bedingungen 
verbesserte Regeneration oder erhohtes Wachstum ermoglicht 
(zum Beispiel nutritive Marker, hormonpr oduz i er ender Marker wie 
ipt; s.u.). Eine andere Form positiver Selektionsmarker umfasst 

15 mutierte Proteine oder RNAs, die gegenuber einem selektiven Agenz 
nicht empfindlicli sind (beispielsweise 16S rRNA Mutanten, die 
unempfindlich gegeniiber Spectinomycin sind) . Negative Selektions- 
marker wirken beispielsweise dadurch, dass sie die Bildung einer 
toxischen Substanz in den trans formier ten Zellen katalysieren 

20 (zum Beispiel das codA Gen) . 

1 . 1 Positive Selektionsmarker : 

Die DNA-Konstrukte konnen zur weiteren Steigerung der Effizienz 
25 zusatzliche positive Selektionsmarker umfassen. In einer bevor- 
zugten Ausfuhrungsf orm kann so das erf indungsgemafce Verfahren 
im Form einer doppelten Selektion realisiert werden, wobei 
zusammen mit der zu insertierenden Nukleinsauresequenz ein 
Sequenz kodierend fur eine Resistenz gegen mindestens ein Toxin, 
30 Antibiotikum oder Herbizid eingebraoht wird, und die Selektion 
zusatzlich unter Einsatz des Toxins, Antibiotikums oder Herbizids 
erfolgt . 

Entsprechende Proteine und Sequenzen von positiven Selektions- 
35 markern sowie Selektionsverf ahren sind dem Fachmann gelaufig. Der 
Selektionsmarker verleiht den erfolgreich transformierten Zellen 
eine Resistenz gegen ein Biozid (zum Beispiel ein Herbizid wie 
Phosphinothricin, Glyphosat oder Bromoxynil) , einen Metabolismus- 
inhibitor wie 2-Desoxyglucose-6-phosphat (WO 98/45456) oder ein 
40 Antibiotikum, wie zum Beispiel Tetracycline, Ampicillin, Kana- 
mycin, G 418, Neomycin, Bleomycin oder Hygromycin. Beispielhaft 
als Selektionsmarker seien genannt: 

Phosphinothricinacetyltransferasen (PAT) , welche die freie 
45 Aminogruppe des Glutaminsynthaseinhibitors Phosphinothricin 

(PPT) acetylieren und damit eine Detoxif izierung des PPT 
erreichen (de Block et al. (1987) EMBO J 6:2513-2518) (auch 
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Bialophos® Resistenzgen (bar) genannt) . Entsprechende 
Sequenzen sind dem Fachmann bekannt (aus Streptomyces hygro- 
scopicus GenBank Acc.-No.: X17220 und X05822, aus Strepto- 
myces viridochromogenes GenBank Acc.-No.: M 22827 und X65195; 
US 5,489,520). Ferner sind synthetische Gene far die 
Expression in Plastiden beschrieben. Ein synthetisches 
PAT-Gen ist beschrieben in Becker et al . (1994) Plant J 
5:299-307. Die Gene verleihen Resistenz gegen das Herbizid 
Bialaphos oder Glufosinat und sind vielbenutzer Marker in 
transgenen Pflanzen (Vickers JE et al. (1996) Plant Mol 
Miol Reporter 14:363-368; Thompson CJ et al. (1987) EMBO J 
6:2519-2523) . 

5-Enolpyruvylshikimat-3-phosphatsynthasen (EPSPS) , die eine 
Resistenz gegen Glyphosat (N- (phosphonomethyl) glycin) ver- 
leihen. Das unselektive Herbizid Glyphosat hat die 5-Enol- 
pyruvyl-3-phosphoshikimatsynthase (EPSPS) als molekulares 
Target. Diese hat eine Schlusselfunktion in der Biosynthese 
aromatischer Aminosauren in Mikroben und Pflanzen, jedoch 
nicht in Saugern (Steinruckgn HC et al. (1980) Biochem Bio- 
phys Res Commun 94:1207-1212; Levin JG und. Sprinson DB 
(1964) J Biol Chem 239:1142-1150; Cole DJ (1985) Mode of 
action of glyphosate a literature analysis, p. 48-74. In: 
Grossbard E und Atkinson D (eds.) . The herbicide glyphosate. 
Buttersworths , Boston.). Glyphosat-tolerante EPSPS Varianten 
werden bevorzugt als Selektionsmarker verwendet (Padgette SR 
et al. (1996). New weed control opportunities: development of 
soybeans with a Roundup Ready™ gene. In: Herbicide Resistant 
Crops (Duke, S.O., ed.), pp. 53-84. CRC Press, Boca Raton, 
FL; Saroha MK und Malik VS (1998) J Plant Biochemistry and 
Biotechnology 7:65-72). Das EPSPS Gen des Agrobakterium sp. 
strain CP4 hat eine naturliche Toleranz gegen Glyphosat, 
die auf entsprechende transgene Pflanzen trans feriert 
werden kann. Das CP4 EPSPS Gen wurde aus Agrobakterium sp. 
strain CP4 kloniert (Padgette SR et al . (1995) Crop Science 
35 (5) :1451-1461) . Sequenzen von EPSPS-Enzymen, die Glyphosat- 
tolerant sind, sind beschrieben (u.a. in US 5,510,471; 
US 5,776,760; US 5,864,425; US 5,633,435; US 5,627;061; 
US 5,463,175; EP 0 218 571). Weitere Sequenzen sind 
beschrieben unter GenBank Acc.-No: X63374 oder M10947. 

Glyphosat® degradierende Enzyme (gox Gen; Glyphosatoxido- 
reduktase) . GOX (beispielsweise die Glyphosatoxidoreductase 
aus Achromobacter sp.) katalysiert die Spaltung einer C-N 
Bindung im Glyphosat, welches so zu Aminomethylphosphonsaure 
(AMPA) und Glyoxylat umgesetzt wird. GOX kann dadurch eine 
Resistenz gegen Glyphosat vermitteln (Padgette SR et al . 
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(1996) J Nutr 126 (3 ): 702-16 ; Shah D et al . (1986) Science 
233 : 478-481) . 



Das deh Gen kodiert fur eine Dehalogenase, die Dalapon® 
5 inaktiviert (GenBank Acc.-No.: AX022822, AX022820 sowie 

WO 99/27116) 



10 



Die bxn Gene kodieren fur Bromoxynil degradierende Nitrilase- 
enzyme (Genbank Acc.-No: E01313 und J03196) . 



Neomycinphosphotransf erasen verleihen eine Resistenz 
gegen Antibiotika (Aminoglykoside) wie Neomycin, G418, 
Hygromycin, Paromomycin oder Kanamycin, indem sie 
durch eine Phosphorylierungsreaktion deren inhibierende 

15 Wirkung reduzieren. Besonders bevorzugt ist das nptll Gen. 

Sequenzen konnen aus der GenBank erhalten werden (AF080390; 
AF080389) . Zudem ist das Gen bereits Bestandteil zahlreicher 
Expressionsvektoren und kann unter Verwendung von dem 
Fachmann gelaufigen Verfahren aus diesen isoliert werden 

20 (AF234316; AF234315; AF234314) . Das NPTII Gen kodiert fur 

eine Aminoglycosid-3 ' 0-phospho trans f erase aus E.coli, Tn5 
(GenBank Acc.-No: U00004 Position 1401-2300; Beck et al . 
(1982) Gene 19 327-336). 



25 - Das D0G R 1-Gen wurde aus der Hefe Saccharomyces cerevisiae 
isoliert (EP-A 0 807 836) und kodiert fur eine 2-Desoxy- 
glukose-6-phosphat Phosphatase, die eine Resistenz gegenuber 
2-DOG verleiht (Randez-Gil et al . (1995) Yeast 11:1233-1240; 
Sanz et al . (1994) Yeast 10:1195-1202, GenBank Acc.-No.: 

30 NC001140; Position 194799-194056). 



- Acetolactatsynthasen, die eine Resistenz gegen Imidazolinon/ 
Sulf onylurea-Herbizide verleihen (GenBank Acc-No. : X51514; 
Sathasivan K et al . (1990) Nucleic Acids Res. 18(8):2188); 
35 AB049823; AF094326; X07645; X07644; A19547; A19546; A19545; 

105376; 105373; AL133315) 



Hygromycinphosphotransf erasen (z.B. GenBank Acc-No . : X74325) 
die eine Resistenz gegen das Antibiotikum Hygromycin ver- 

40 leihen. Das Gen ist Bestandteil zahlreicher Expressions- 

vektoren und kann unter Verwendung von dem Fachmann 
gelaufigen Verfahren (wie beispielsweise Polymeraseketten- 
reaktion) aus diesen isoliert werden (GenBank Acc-No.: 
AF294981; AF234301; AF234300; AF234299; AF234298; AF354046; 

45 AF354045) 
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Res i s tenzgene gegen 



10 



a) Chloramphenicol (Chloramphenicolacetyl transferase) , 

b) Tetracyclin (u.a. GenBank Acc-No.: X65876; X51366) . Zudem 
ist das Gen bereits Bestandteil zahlreicher Expressions- 
vektoren und kann unter Verwendung von dem Fachmann 
gelaufigen Verfahren (wie beispielsweise Polymerase- 
kettenreaktion) aus diesen isoliert werden 

c) Streptomycin (u.a. GenBank Ac c . -No . : AJ278607) . 



d) Zeocin, das entsprechende Resistenzgen ist Bestandteil 
zahlreicher Klonierungsvektoren ( z . B . GenBank Acc . -No . : 

15 L3 6849) und kann unter Verwendung von dem Fachmann 

gelaufigen Verfahren (wie beispielsweise Polymerase- 
kettenreaktion) aus diesen isoliert werden. 

e) Ampicillin (^-Lactamase Gen; Datta N, Richmond MH 
20 (1966) Biochem J 98(l):204-9; Heffron F et al (1975) 

J. Bacterid 122: 250-256; Bolivar F et al. (1977) 
Gene 2:95-114). Die Sequenz ist Bestandteil zahlreicher 
Klonierungsvektoren und kann unter Verwendung von dem 
Fachmann gelaufigen Verfahren (wie beispielsweise Poly- 
25 merasekettenreaktion) aus diesen isoliert werden. 



Gene wie die Isopentenyl transferase aus Agrobakterium tumefaciens 
(strain:P022) (Genbank Acc. -No.: AB025109) konnen auch als Selek- 

tionsmarker eingesetzt werden. Das ipt Gen ist ein Schlusselenzym 
30 der Cytokinin-Biosynthese . Seine Uberexpression erleichtert die 

Regeneration von Pflanzen (z.B. Selektion auf Cytokinin-f reiem 

Medium) . Das Verfahren zur Nutzung des ipt Gens ist beschrieben 
(Ebinuma H et al. (2000) Proc Natl Acad Sci USA 94:2117-2121; 

Ebinuma H et al . (2000) Selection of Marker-free transgenic 
35 plants using the oncogenes (Ipt, rol A, B, C) of Agrobakterium 

as selectable markers, In Molecular Biology of Woody Plants. 

Kluwer Academic Publishers) . 

Verschiedene weitere positive Selektionsmarker , die den trans- 
40 formierten Pflanzen einen Wachs turns vorteil gegentiber nicht-trans- 
formierten verleihen, sowie Verfahren zu ihrer Verwendung sind 
u.a. beschrieben in EP-A 0 601 092. Beispielhaft sind zu nennen 
(^-Glucuronidase (in Verbindung mit z.B. Cytokininglucuronid) , 
Mannose-6-phosphat-Isomerase (in Verbindung mit Mannose) , UDP- 
45 Galaktose-4-Epimerase (in Verbindung mit z.B. Galactose) . 
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Fiir einen in Plastiden f unktionellen Selektionsmarker sind ins- 
besondere solche bevorzugt, die eine Resistenz gegen Spectino- 
mycin, Streptomycin, Kanamycin, Lincomycin, Gentamycin, Hygro- 
mycin, Methotrexate Bleomycin, Phleomycin, Blasticidin, Sulfon- 
5 amid,, Phosphinotricin, Chlorsulfuron, Bromoxymil, Glyphosat, 
2, 4-Datrazin, 4 -methyl tryptophan, Nitrat, S - amino e thy 1- 
L-cysteine, Lysin/Threonin, Aminoethyl-Cystein oder Betainaldehyd 
verleihen. Besonders bevorzugt sind die Gene aadA, nptll, BADH, 
FLARE-S (eine Fusion aus aadA und GFP, beschrieben bei Khan MS 

10 & Maliga P (1999) Nature Biotech 17:910-915). Geeignet ist vor 
allem das aadA Gen (Svab Z und Maliga P (1993) Proc Natl Acad 
Sci USA 90:913-917). Ferner beschrieben sind modifizierte 16S 
rDNA sowie die Betainealdehyddehydrogenase (BADH) aus Spinat 
(Daniell H et al . (2001) Trends Plant Science 6:237-239; Daniell 

15 H et al. (2001) Curr Genet 39:109-116; WO 01/64023; WO 01/64024; 
WO 01/64850) . Auch lethal wirkende Agenzen wie beispielsweise 
Glyphosat konnen in Verbindung mit entsprechend detoxif izierenden 
oder resistenten Enzymen genutzt werden (WO 01/81605) . 

20 Die jeweils ftir die Selektion verwendeten Konzentrationen 

der Antibiotika, Herbizide, Biozide oder Toxine mussen an die 
jeweiligen Testbedingungen bzw. Organismen angepasst werden. 
Beispielhaft seien fur Pflanzen zu nennen Kanamycin (Km) 50 mg/L, 
Hygromycin B 40 mg/L, Phosphinothricin (Ppt) 6 mg/L, Sepctino- 

25 mycin (Spec) 500 mg/L. 

2 . Reporter gene 

Reportergene kodieren fur leicht quantif izierbare Proteine 
30 und gewahrleisten so uber Eigenfarbe oder Enzymaktivitat eine 

Bewertung der Transf ormationsef f izienz , des Expressionsortes oder 
-zeitpunktes . Ganz besonders bevorzugt sind dabei Gene kodierend 
"EUir Reporter-Proteine (siehe auch Schenborn E, Groskreutz D 
(1999) Mol Biotechnol 13(l):29-44) wie 

35 

"green fluorescence protein" (GFP) (Chui WL et al, (1996) 
Curr Biol 6:325-330; Leffel SM et al . (1997) Biotechniques 
23(5):912-8; Sheen et al . (1995) Plant J 8 (5 ): 777-784 ; 
Haseloff et al . (1997) Proc Natl Acad Sci USA 94(6): 
40 2122-2127; Reichel et al . (1996) Proc Natl Acad Sci USA 

93 (12) :5888-5893; Tian et al . (1997) Plant Cell Rep 
16:267-271; WO 97/41228) 

- Chloramphenicol transf erase 

45 
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Luzif erase (Millar et al . (1992) Plant Mol Biol Rep 10: 
324-414; Ow et al . (1986) Science 234:856-859); erlaubt 
Bioluminescenzdetektion 

5 - P-Galactosidase (kodiert fur ein Enzym far das verschiedenen 
chromogene Substrate zur Verfiigung stehen) 

S-Glucuronidase (GUS) (Jefferson et al. (1987) EMBO J 6: 
3901-3907) oder das uidA Gen (kodieren fur Enzyme fur die 
10 verschiedene chromogene Substrate zur Verfiigung stehen) 

R-Locus Genprodukt, das die Produktion von Anthocyanin- 
pigmenten (rote Farbung) in pflanzlichen Gewebe reguliert und 
so eine direkte Analyse der Promoteraktivitat ohne Zugabe 
15 zusatzlicher Hilfsstoffe oder chromogener Substrate ermog- 

licht (Dellaporta et al. (1988) In: Chromosome Structure 
and Function: Impact of New Concepts, 18 th Stadler Genetics 
Symposium, 11 : 263-282) 

20 - Tyrosinase (Katz et al.(1983) J Gen Microbiol 129:2703- 

2714), Enzym, das Tyrosin zu DOPA und Dopaquinon oxidiert, 
die infolge das leicht nachweisbare Melanin bilden. 

Aequorin (Prasher et al.(1985) Biochem Biophys Res Commun 
25 126 (3) : 1259-1268) , kann in der Calcium-sensitiven Bio- 

luminescenzdetektion verwendet werden. 



3. Replikationsursprunge, die eine Vermehrung der erfindungs- 
gemaJSen Expressionskassetten oder Vektoren in zum Beispiel 

30 E.coli gewahrleisten. Beispielhaft seien genannt ORI (origin 

of DNA replication) , der pBR322 ori oder der P15A ori 
(Sambrook et al . : Molecular Cloning. A Laboratory Manual, 
2 nd ed. Cold Spring Harbor Laboratory Press, Cold Spring 
Harbor, NY, 1989) . 

35 

4. Elemente zum Beispiel "Bordersequenzen" , die einen Agro- 
bakterien-vermittelte Transfer in Pf lanzenzellen fur 
die Obertragung und Integration ins Pf lanzengenom ermog- 
lichen, wie zum Beispiel die rechte oder linke Begrenzung 

40 der T-DNA oder die vir-Region. 

5. Multiple Klonierungsregionen (MCS) erlauben und erleichtern 
die Insertion eines oder mehrerer Nukleinsauresequenzen. 

45 Die Einfuhrung von Nukleinsauresequenzen (z.B. Expressions- 
kassetten) in einen pflanzlichen Organismus oder Zellen, Geweben, 
Organe, Teile bzw. Samen desselben kann vorteilhaft unter Ver- 



BASF Plant Science GmbH 20020471 



PF 53790 DE 




wendung von Vektoren realisiert werden, in denen diese Sequenzen 
enthalten sind. Vektoren konnen beispielhaft Plasmide, Cosmide, 
Phagen, Viren oder auch Agrobakterien sein. Die Sequenzen konnen 
in den Vektor (bevorzugt ein Plasmidvektor) tiber geeignete 
5 Restriktionsschnittstellen insertiert werden. Der entstandene 
Vektor kann zunachst in E.coli eingefiihrt und amplif iziert 
werden. Korrekt transf ormierte E.coli werden selektioniert , 
gezuchtet und der rekombinante Vektor mit dem Fachmann gelaufigen 
Methoden gewonnen. Restriktionsanalyse und Sequenzierung konnen 
10 dazu dienen, den Klonierungsschritt zu uberprufen. Bevorzugt sind 
solche Vektoren, die eirie stabile Integration in das Wirtsgenom 
ermoglichen. 

Die Herstellung eines transf ormier ten Organismus (bzw. einer 

15 transf ormierten Zelle oder Gewebes) erfordert, dass die ent- 

sprechende DNA (z-.B. der Transf ormationsvektor) oder RNA in die 
entsprechende Wirtszelle eingebracht wird. Fur diesen Vorgang, 
der als Transformation (oder Transduktion bzw. Transf ektion) 
bezeichnet wird, steht eine Vielzahl von Methoden und Vektoren 

20 zur Verftigung (Keown et al . (1990) Methods in Enzymology 

185:527-537; Plant Molecular Biology and Biotechnology (CRC 
Press, Boca Raton, Florida), Kapitel 6/7, S. 71-119 (1993); 
White FF (1993) Vectors for Gene Transfer in Higher Plants; in: 
Transgenic Plants, Bd. 1, Engineering and Utilization, Hrsgb. : 

25 Kung und Wu R, Academic Press, 15-3 8; Jenes B et al . (1993) 
Techniques for Gene Transfer, in: Transgenic Plants, Bd. 1, 
Engineering and Utilization, Hrsgb. : Kung und R. Wu, Academic 
Press, S. 128-143; Potrykus (1991) Annu Rev Plant Physiol Plant 
Molec Biol 42:205-225; Halford NG, Shewry PR (2000) Br Med Bull 

30 56(1) :62-73) . 

Beispielsweise kann die DNA oder RNA direkt durch Mikroinj ektion 
(WO 92/09696, WO 94/00583, EP-A 0 331 083, EP-A 0 175 966) oder 
durch Bombardierung mit DNA bzw. RNA-beschichteten Mikropartikeln 

35 (biolistische Verfahren mit der Genkanone "particle bombardment"; 
US 5,100,792; EP-A 0 444 882; EP-A 0 434 616; Fromm ME et al . 
(1990) Bio/Technology 8 (9):833-9; Gordon-Kamm et al . (1990) Plant 
Cell 2:603) eingefiihrt werden. Auch kann die Zelle chemisch, zum 
Beispiel mit Polyethylenglycol , permeabilisiert werden, so dass 

40 die DNA durch Diffusion in die Zelle gelangen kann. Die DNA kann 
auch durch Protoplastenf usion mit anderen DNA-enthaltenden Ein- 
heiten wie Minicells, Zellen, Lysosomen oder Liposomen (Freeman 
et al. (1984) Plant Cell Physiol. 29:1353ff; US 4,536,475) 
erfolgen. Elektroporation ist eine weitere geeignete Methode 

45 zur Einfuhrung von DNA, bei der die Zellen reversibel durch 
einen elektrischen Impuls permeabilisert werden (EP-A 290 395, 
WO 87/06614) . Weitere Verfahren umfassen die Calciumphosphat- 
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vermittelte Transformation, die DEAE-Dextran-vermittelte Trans- 
formation, die Inkubation trockener Embryonen in DNA-hal tiger 
Losung, oder andere Methoden der direkten DNA-Einfiihrung 
(DE 4 005 152, WO 90/12096, US 4,684,611). Entsprechende Ver- 
5 fahren sind beschrieben (beispielsweise bei Bilang et al . (1991) 
Gene 100:247-250; Scheid et al . (1991) Mol Gen Genet 228:104-112; 
Guerche et al . (1987) Plant Science 52:111-116; Neuha^use et al . 
(1987) Theor Appl Genet 75:30-36; Klein et al . (1987) Nature 
327:70-73; Howell et al . (1980) Science 208:1265; Horsch et 

10 al.(1985) Science 227:1229- 1231; DeBlock et al . (1989) Plant 
Physiology 91:694-701; Methods for Plant Molecular Biology 
(Weissbach and Weissbach, eds . ) Academic Press Inc.* (1988); and 
Methods in Plant Molecular Biology (Schuler and Zielinski, eds.) 
Academic Press Inc. (1989)). Physikalische Methoden der DNA- 

15 Einfiihrung in pflanzliche Zelle sind im Uberblick dargestellt 
bei Oard (1991) Biotech Adv 9:1-11. 

Im Falle dieser "direkten" Transf ormationsmethoden sind keine 
besonderen Anf orderungen an das verwendete Plasmid gestellt. 
20 Einfache Plasmide wie die der pJJC-Reihe, pBR322, M13mp Reihe, 
PACYC184 etc. konnen verwendet werden. 

Neben diesen "direkten" Transf ormationstechniken kann eine Trans- 
formation auch durch bakterielle Infektion mittels Agrobacterium 
25 (z.B. EP 0 116 718), virale Infektion mittels viraler Vektoren 
(EP 0 067 553; US 4,407,956; WO 95/34668; WO 93/03161) oder 
mittels Pollen (EP 0 270 356; WO 85/01856; US 4 , 684 , 611) durch- 
gefiihrt werden. 

30 Bevorzugt erfolgt die Transformation mittels Agrobacterien, 
die "entwaffnete" (disarmed) Ti-Plasmidvektoren enthalten, 
wobei deren natiirliche Fahigkeit zum Gentransfer auf Pflanzen 
genutzt wird (EP-A 0 270 355; EP-A 0 116 718). Agrobacterium- 
Trans formation ist weit verbreitet ftir die Transformation von 

35 Dicotyledonen, wird aber auch zunehmend auf Monocotyledonen 
angewandt (Toriyama et al . (1988) Bio/Technology 6: 1072-1074; 
Zhang et al . (1988) Plant Cell Rep 7:379-384; Zhang et al. (1988) 
Theor Appl Genet 76:835-840; Shimamoto et al . (1989) Nature 
338:274-276; Datta et al . (1990) Bio/Technology 8: 736-740; 

40 Christou et al . (1991) Bio/Technology 9:957-962; Peng et al . 

(1991) International Rice Research Institute, Manila, Philippines 
563-574; Cao et al . (1992) Plant Cell Rep 11:585-591; Li et al . 
(1993) Plant Cell Rep 12:250-255; Rathore et al . (1993) Plant Mol 
Biol 21:871-884; Fromm et al . (1990) Bio/Technology 8:833-839; 

45 Gordon-Kamm et al . (1990) Plant Cell 2:603-618; D'Halluin et al . 

(1992) Plant Cell 4:1495-1505; Walters et al . (1992) Plant Mol 
Biol 18:189-200; Koziel et al . (1993) Biotechnology 11:194-200; 
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Vasil IK (1994) Plant Mol Biol 25:925-937; Weeks et al . (1993) 
Plant Physiol 102:1077-1084; Somers et al . (1992) Bio/Technology 
10:1589-1594; WO 92/14828; Hiei et al . (1994) Plant J 6:271-282). 

5 Die fur die Agrobacterium-Transf ormation meist verwendeten Stamme 
Agrobacterium tumef aciens oder Agrobacterium rhizogenes enthalten 
ein Plasmid (Ti bzw. Ri Plasmid) , das auf die Pflanze nach Agro- 
bakterium-Infektion ubertragen wird. Ein Teil dieses Plasmids, 
genarmt T-DNA (transferred DNA) , wird in das Genom der Pflanzen- 
10 zelle integriert. Alternativ konnen durch Agrobakterium auch 
binare Vektoren (Mini-Ti-Plasmide) auf Pflanzen ubertragen und 
in der en Genom integriert werden. 

Die Anwendung von Agrobakterium tumefaciens fur die Trans- 
15 formation von Pflanzen unter Verwendung von Gewebekultur- 
explantaten ist beschrieben (u.a. Horsch RB et al. (1985) 
Science 225:1229ff; Fraley et al . (1983) Proc Natl Acad Sci 
USA 80: 4803-4807; Bevans et al . (1983) Nature 304:184-187). 
Viele Stamme yon Agrobakterium tumefaciens sind in der Lage, 
20 genetisches Material zu ubertragen, wie z.B. die Stamme 

EHA101[pEHA101] , EHA105 [pEHA105 ] , LBA4404 [pAL4404] , C58Cl[pMP90] 
und C58Cl[pGV2260] (Hood et al . (1993) Transgenic Res 2:208-218; 
Hoekema et al . (1983) Nature 303:179-181; Koncz and Schell (1986) 
Gen Genet 204:383-396; Deblaere et al . (1985) Nucl Acids Res 13: 
25 4777-4788) . 

Werden Agrobacterien verwendet, so ist die Expressionskassette 
in spezielle Plasmide zu integrieren, entweder in einen Zwischen- 
vektor (englisch: shuttle or intermediate vector) oder einen 

30 binaren Vektor. Wird ein Ti oder Ri Plasmid zur Transformation 
verwendet, ist zumindest die rechte Begrenzung, meistens jedoch 
die rechte und die linke Begrenzung der Ti oder Ri Plasmid T-DNA 
als flankierende Region mit der einzufuhrenden Expressionskas- 
sette verbunden. Bevorzugt werden binare Vektoren verwendet. 

35 Binare Vektoren kSnnen sowohl in E.coli als auch in Agrobacterium 
replizieren und enthalten die zur Ubertragung in ein pflanzliches 
System erf order lichen Komponenten. Sie enthalten in der Regel ein 
Selektionsmarkergen fur die Selektion trans formierter Pflanzen 
(z.B. das nptll Gen, das eine Resistenz gegen Kanamycin verleiht) 

40 und einen Linker oder Polylinker flankiert von der rechten und 
linken T-DNA Begrenzungsseguenz . Aufcerhalb der T-DNA-Begrenzungs- 
sequenz enthalten sie zudem noch einen Selektionsmarker , der eine 
Selektion trans formierter E.coli und/oder Agrobakteria ermoglicht 
(z.B. das nptlll Gen, das eine Resistenz gegen Kanamycin ver- 

45 leiht) . Entsprechende Vektoren konnen direkt in Agrobakterium 
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trans formiert werden (Holsters et al . (1978) Mol Gen Genet 
163:181-187) . 



Binarvektoren basieren z.B. auf ''broad host range "-Plasmi den 
5 wie pRK252 (Bevan et al . (1984) Nucl Acid Res 12,8711-8720) und 
PTJS75 (Watson et al . (1985) EMBO J 4(2):277- 284). Eine grosse 
Gruppe der verwendeten Binarvektoren leitet sich vom pBIN19 
(Bevan et al . (1984) Nucl Acid Res 12:8711-872 0) ab. Hajdukiewicz 
et al. entwickelten einen Binarvektor (pPZP) , der kleiner und ef- 
10 fizienter als die bisher ttblichen ist (Hajdukiewicz et al . (1994) 
Plant Mol Biol 25:989-994). Verbesserte und besondere bevor- 
zugte binare Vektorsysteme zur Agrobakterium-vermittelten Trans- 
formation sind in WO 02/009 00 beschrieben. 

15 Die mit einem solchen Vektor transf ormierten Agrobakterien konnen 
dann in bekannter Weise zur Transformation von Pflanzen, ins- 
besondere von Kulturpf lanzen, wie z.B. von Raps, verwendet 
werden, indem beispielsweise verwundete Blatter oder Blattstucke 
in einer Agrobakterienlosung gebadet und anschliessend in geeig- 

20 neten Medien kultiviert werden. Die Transformation von Pflanzen 
durch Agrobakterien ist beschrieben (White FF, Vectors for 
Gene Transfer in Higher Plants; in Transgenic Plants, Vol. 1, 
Engineering and Utilization, herausgegeben von S.D. Kung und 
R. Wu, Academic Press, 1993, S. 15-38; Jenes B et al.(1993) 

25 Techniques for Gene Transfer, in: Transgenic Plants, Vol. 1, 
Engineering and Utilization, herausgegeben von S.D. Kung und 
R. Wu, Academic Press, S. 128-143; Potrykus (1991) Annu Rev 
Plant Physiol Plant Molec Biol 42:205- 225). Aus den trans- 
f ormierten Zellen der verwundeten Blatter bzw. Blattstucke 

30 konnen in bekannter Weise transgene Pflanzen regeneriert werden. 

Fur die Transformation konnen unterschiedliche Explantate, Zell- 
kulturen, Gewebe, Organen, Embryonen, Samen, Mikrosporen oder 
anderen einzelzelligen oder mehrzelligen zellulare Strukturen 

35 abgeleitet von einem pflanzlichen Organismus eingesetzt werden. 
Auf die jeweiligen Explantate, Kulturen oder Gewebe abgestimmte 
Transf ormationsverf ahren sind dem Fachmann bekannt. Beispielhaft 
seien zu nennen: Sprossinternodien (Fry J et al . (1987) Plant 
Cell Rep. 6:321-325), Hypokotyle (Radke SE et al . (1988) Theor 

40 Appl Genet 75:685-694; Schroder M et al . (1994) Physiologia Plant 
92: 37-46.; Stefanov I et al . (1994) Plant Sci . 95:175-186; Weier 
et al. (1997) Fett/Lipid 99:160-165), kotyledonare Petiolen 
(Meloney MM et al . (1989) Plant Cell Rep 8:238-242; Weier D 
et al. (1998) Molecular Breeding 4:39-46), Mikrosporen und Pro- 

45 embryonen (Pechnan (1989) Plant Cell Rep. 8:387-390) und Blttten- 
stiele (Boulter ME et al. (1990) Plant Sci 70:91-99; Guerche P 
et al. (1987) Mol Gen Genet 206:382-386). Bei einem direkten Gen- 
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transfer konnen Mesophyllprotoplasten (Chapel PJ & Glimelius K 
(1990) Plant Cell Rep 9: 105-108; Golz et al . (1990) Plant 
Mol Biol 15:475-483) aber auch Hypokotylprotoplasten (Bergmann 
P & Glimelius K (1993) Physiologia Plant 88:604-611). und Mikro- 
5 sporen (Chen JL et al. (1994) Theor Appl Genet 88:187-192; 
Jonesvilleneuve E et al. (1995) Plant Cell Tissue and Organ 
Cult 40:97-100) und Sprossabschnitte (Seki M et al . (1991) 
Plant Mol Biol 17:259-263) erfolgreich eingesetzt werden. 

10 Stabil trans formierte Zellen d.h. solche, die die eingefiihrte 
DNA ihtegriert in die DNA der Wirtszelle enthalten, konnen von. 
untransf ormierten unter Einsatz des erf indungsgemaSen Selektions- 
verfahrens selektioniert werden. Die erhaltenen Pflanzen konnen 
in ublicher Weise gezuchtet und gekreuzt werden. Zwei oder mehr 

15 Generationen sollten vorzugsweise kultiviert werden, um sicher- 
zustellen, dass die genomische Integration stabil und vererblich 
ist . 

Sobald eine trans formierte Pf lanzenzelle hergestellt wurde, kann 
20 eine vollstandige Pflanze unter Verwendung von dem Fachmann 

bekannten Verfahren erhalten werden. Hierbei geht man beispiel- 
haft von Kalluskulturen, einzelnen Zellen (z.B. Protoplasten) 
oder Blattscheiben aus (Vasil et al. (1984) Cell Culture and 
Somatic Cel Genetics of Plants, Vol I, II and III, Laboratory 
25 Procedures and nTheir Applications, Academic Press; Weissbach and 
Weissbach (1989) Methods for Plant Molecular Biology, Academic 
Press) . Aus diesen noch undif f erenzierten Callus-Zellmassen kann 
die Bildung von Sprdss und Wurzel in bekannter Weise induziert 
werden. TDie erhaltenen Sprosslinge konnen ausgepflanzt und 
30 gezUchtet werden. Entsprechende Verfahren sind beschrieben 
(Fennell et al . (1992) Plant Cell Rep. 11: 567-570; Stoeger 
et al. (1995) Plant Cell Rep. 14:273-278; Jahne et al . (1994) 
Theor Appl Genet 89:525-533). 

35 Die Wirksamkeit der Expression der transgen exprimierten Nuklein- 
sauren kann beispielsweise in vitro durch Sprossmeristemver- 
mehrung unter Verwendung einer der oben beschriebenen Selektions- 
methoden ermittelt werden. Zudem kann eine in Art und Hohe ver- 
anderte Expression eines Zielgens und die Auswirkung auf den 

40 Phanptyp der Pflanze an Testpflanzen in Gewachshausversuchen 
getestet werden. 

Bevorzugt wird das erf indungsgemafce Verfahren im Rahmen der 
Pf lanzenbiotechnologie zur Erzeugung von Pflanzen mit vor- 
45 teilhaften Eigenschaf ten eingesetzt. Die in das Genom der 
pflanzlichen Zelle oder des pflanzlichen Organismus zu 
• insert! erende Nukleinsauresequenz" umfasst bevorzugt min- 
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destens eine Expressionskassette, wobei besagte Expressions- 
kassette unter Kontrolle eines in pflanzlichen Zellen oder 
pflanzlichen Organismen funktionellen Promotors eine RNA und/oder 
ein Protein exprimieren kann, welche nicht die Verminderung der 
5 Expression, Menge, Aktivitat und/oder Funktion eines Marker- 
proteins bewirken, sondern - besonders bevorzugt - der so 
genetische veranderten Pflanze einen vorteilhaf ten Phanotyp ver- 
leihen. Dem Fachmann sind zahlreiche Gene und Proteine bekannt, 
die zum Erreichen eines vorteilhaf ten Phanotyp beispielsweise 
10 zur Qualitatssteigerung bei Nahrungsmitteln oder zur Produktion 
bestimmter Chemikalien oder Pharmazeutika (Dunwell JM (2000) 
J Exp Bot 51 Spec No: 487-96) verwendet werden konnen. 

So kann die Eignung der Pflanzen oder deren Samen als Nahrungs- 
15 oder Futtermittel verbessert werden, beispielsweise liber eine 
Veranderung der Zusairanensetzungen und/oder des Gehalt an Meta- 
boliten, insbesondere Proteinen, Olen, Vitaminen und/oder Starke. 
Auch konnen Wachstumsrate, Ertrag oder die Resistenz gegen bio- 
tische oder abiotische Stressf aktoren erhoht werden. Vorteilhaf te 
20 Effekte konnen sowohl durch transgene Expression von Nuklein- 
sauren oder Proteinen als auch durch gezielte Verminderung der 
Expression endogener Gene hinsichtlich des Phanotypes der trans- 
genen Pflanze erzielt werden. Die in der transgenen Pflanze zu 
erzielenden vorteilhaf ten Effekte umfassen beispielsweise: 

25 

- Erhohte Resistenz gegen Pathogene (biotischer Stress) 

- Erhohte Resistenz gegen Umwelteinf liisse wie Hitze, Kalte, 
Frost Trockenheit, UV-Licht, oxidativen Stress, Nasse, Salz 

30 etc. (abiotischer Stress) 

- Erhohte Ertrags lei stung 

- Verbesserte Qualitat z.B. erhohter Nahrwert, erhohte Lager- 
35 fahigkeit 

Ein weiterer Gegenstand der Erfindung betrif ft die Verwendung der 
nach dem erf indungsgemassen Verfahren hergestellten transgenen 
Pflanzen, und der von ihnen abgeleitete Zellen, Zellkulturen, 

40 Teile oder Vermehrungsgut wie Saaten oder Frtichte, zur Her- 
stellung von Nahrungs- oder Futtermitteln, Pharmazeutika 
oder Feinchemikalien, wie beispielsweise Enzymen, Vitaminen, 
Aminos^uren, Zucker, Fettsauren, natiirliche und synthetische 
Geschmacks-, Aroma- und Farbstoffe. Besonders bevorzugt ist die 

45 Produktion von Triaclyglyceriden, Lipiden, Olen, Fettsauren, 
Starke, Tocopherolen und Tocotrienolen sowie Carotinoiden. Von 
Menschen und Tieren verzehrbare erf indungsgemafee , genetisch 
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veranderte Pflanzen konnen auch beispielsweise direkt oder nach 
an sich bekannter Aufbereitung als Nahrungsmittel oder Futter- 
mittel verwendet werden. 

5 Sequenzen 

1. SEQ ID NO: 1 Nukleinsauresequenz kodierend ftir Cytosin- 

deaminase aus E.coli (codA) 

10 2. SEQ ID NO: 2 Amino sauresequenz kodierend far Cytosin- 

deaminase aus E.coli (codA) 

3. SEQ ID NO: 3 Nukleinsauresequenz kodierend fur Cytosin- 

deaminase aus E.coli (codA) mit modi fizier tern 
15 Startkodon (GTG/ATG) zur Expression in 

Eukaryoten 

4. SEQ ID NO: 4 Amino sauresequenz kodierend fur Cytosin- 

deaminase aus E.coli (codA) mit modif iziertem 
20 Startkodon (GTG/ATG) zur Expression in 

Eukaryoten 

5. SEQ ID NO: 5 Nukleinsauresequenz kodierend fur Cytochrom 

P450-SU1 (suaC) aus Streptomyces griseolus 

25 

6. SEQ ID NO: 6 Amino sauresequenz kodierend fur Cytochrom 

P450-SU1 (suaC) aus Streptomyces griseolus 

7. SEQ ID NO: 7 Nukleinsauresequenz kodierend fur 

30 Indolacetamidhydrolase (tms2) aus Agrobacterium 

tumef aciens 

8. SEQ ID NO: 8 Amino sauresequenz kodierend fur 

Indolacetamidhydrolase (tms2) aus Agrobacterium 
35 tumef aciens 

9. SEQ ID NO: 9 Nukleinsauresequenz kodierend fur 

Indolacetamidhydrolase (tms2) aus Agrobacterium 
tumef aciens 

40 

10. SEQ ID NO: 10 Amino sauresequenz kodierend fur 

Indolacetamidhydrolase (tms2) aus Agrobacterium 
tumef aciens 



45 
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11. SEQ ID NO: 

5 12. SEQ ID NO: 

13. SEQ ID NO: 

10 

14. SEQ ID NO: 
15 15. SEQ ID NO: 

16. SEQ ID NO: 

20 

17. SEQ ID NO: 
25 18. SEQ ID NO: 

19. SEQ ID NO: 

30 

20. SEQ ID NO: 
35 21. SEQ ID NO: 

22. SEQ ID NO: 

40 

23. SEQ ID NO: 



11 Nukleinsauresequenz kodierend fur Haloalkan- 
dehalogenase (dhlA) aus Xanthobacter 

au t o t r ophi cu s 

12 Aminosauresequenz kodierend fur Haloalkan- 
dehalogenase (dhlA) aus Xanthobacter 
autotroph! cus 

13 Nukleinsauresequenz kodierend fur Thymidin- 
kinase aus Herpes simplex Virus 1 

14 Aminosauresequenz kodierend f\ir Thymidin- 
kinase aus Herpes simplex Virus 1 

15 Nukleinsauresequenz kodierend fur Thymidin- 
kinase aus Herpes simplex Virus 1 

16 Aminosauresequenz kodierend fur Thymidin- 
kinase aus Herpes simplex Virus 1 

t\ 

17 Nukleinsauresequenz kodierend fur Hypoxanthin- 
Xanthin-Guanin Phosphor ibosyl transferase aus 
Toxoplasma gondii 

18 Aminosauresequenz kodierend fur Hypoxanthin- 
Xanthin-Guanin Phosphor ibosyl transferase aus 
Toxoplasma gondii 

19 Nukleinsauresequenz kodierend fur Xanthin- 
Guanin- Phosphor ibosyl transferase aus E . coli 

20 Aminosauresequenz kodierend fur Xanthin-Guanin- 
Phosphor ibosyl transferase aus E.coli 

21 Nukleinsauresequenz kodierend fur Xanthin- 
Guanin- Phosphor ibosyl transferase aus E.coli 

22 Aminosauresequenz kodierend fur Xanthin-Guanin- 
Phosphoribosyl transferase aus E.coli 

23 Nukleinsauresequenz kodierend fur Purin- 
nukleosidphosphorylase (deoD) aus E.coli 



24. SEQ ID NO: 

45 



24 Nukleinsauresequenz kodierend fur Purin- 
nukleosidphosphorylase (deoD) aus E.coli 
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25. SEQ ID NO: 25 Nukleinsauresequenz kodierend fur Phosphonat- 

monoesterhydrolase (pehA) aus Burkholderia 
caryophylli 

5 26. SEQ ID NO: 2 6 Amino sauresequenz kodierend fur Phosphonat- 

monoesterhydrolase (pehA) aus Burkholderia 
caryophylli 

27. SEQ ID NO: 27 Nukleinsauresequenz kodierend fur Tryptophan- 
!0 oxygenase (auxl) aus Agrobacterium rhizogenes 

28. SEQ ID NO: 28 Amino sauresequenz kodierend fur Tryptophan- 

oxygenase (auxl) aus Agrobacterium rhizogenes 

15 29. SEQ ID NO: 2 9 Nukleinsauresequenz kodierend fur Indol- 

acetamidhydrolase (aux2) aus Agrobacterium 
rhizogenes 

30. SEQ ID NO: 30 Amino sauresequenz kodierend fur Indol- 

20 acetamidhydrolase (aux2) aus Agrobacterium 

rhizogenes 

31. SEQ ID NO: 31 Nukleinsauresequenz kodierend fiir Tryptophan- 

oxygenase (auxl) aus Agrobacterium tumefaciens 

25 

32. SEQ ID NO: 32 Ami no sauresequenz kodierend fur Tryptophan- 

oxygenase (auxl) aus Agrobacterium tumefaciens 

33. SEQ ID NO: 33 Nukleinsauresequenz kodierend fur Indol- 
30 acetamidhydrolase (aux2) aus Agrobacterium 

tumefaciens 

34. SEQ ID NO: 34 Amino sauresequenz kodierend fiir Indol- 

acetamidhydrolase (aux2) aus Agrobacterium 
35 tumefaciens 

35. SEQ ID NO: 3 5 Nukleinsauresequenz kodierend fur Indol- 

acetamidhydrolase (aux2) aus Agrobacterium 
vitis 

40 

36. SEQ ID NO: 3 6 Ami no sauresequenz kodierend far Indol- 

acetamidhydrolase (aux2) aus Agrobacterium 
vitis 



45 
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37. SEQ ID NO: 



5 38. SEQ ID NO: 



39. SEQ ID NO: 

10 



40. SEQ ID NO: 

15 

41. SEQ ID NO: 



20 42. SEQ ID NO: 



43. SEQ ID NO: 

25 

44. SEQ ID NO: 



30 

45. SEQ ID NO: 



46. SEQ ID NO: 

35 

47. SEQ ID NO: 



40 48. SEQ ID NO: 



37 Nukleinsauresequenz kodierend fur 5-Methyl- 
thioribosekinase (mtrK) aus Arabidopsis 
thai i ana 

3 8 Aminosauresequenz kodierend fur 5-Methyl- 
thioribosekinase (mtrK) aus Arabidopsis 
thaliana 

39 Nukleinsauresequenz kodierend fur 5-Methyl- 
thioribosekinase (mtrK) aus Klebsiella 
pneumoniae 

40 Aminosauresequenz kodierend fur 5-Methyl- 
thioribosekinase (mtrK) aus Klebsiella 
pneumoniae 

41 Nukleinsauresequenz kodierend fur Alkohol- 
dehydrogenase (adh) aus Arabidopsis thaliana 

42 Aminosauresequenz kodierend fur Alkohol- 
dehydrogenase (adh) aus Arabidopsis thaliana 

43 Nukleinsauresequenz kodierend fur Alkohol- 
dehydrogenase (adh) aus Hordeum vulgare 
(Gerste) 

44 Aminosauresequenz kodierend fur Alkohol- 
dehydrogenase (adh) aus Hordeum vulgare 
(Gerste) 

45 Nukleinsauresequenz kodierend fur Alkohol- 
dehydrogenase (adh) aus Oryza sativa (Reis) 

46 Aminosauresequenz kodierend fur Alkohol- 
dehydrogenase (adh) aus Oryza sativa (Reis) 

47 Nukleinsauresequenz kodierend fur Alkohol- 
dehydrogenase (adh) aus Zea mays (Mais) 

48 Aminosauresequenz kodierend fur Alkohol- 
dehydrogenase (adh) aus Zea mays (Mais) 



45 



49. SEQ ID NO: 



49 Nukleinsauresequenz kodierend fur ein sense-RNA 
Fragment der Cytosindeaminase aus E.coli 
(codARNAi-sense) 
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50. SEQ ID NO: 50 Oligonukleotidprimer codA5 'Hindlll 

5 ' -AAGCTTGGCTAACAGTGTCGAATAACG- 3 ' 



51. SEQ ID NO: 51 Oligonukleotidprimer codA3'SalI 
5 5 ' -GTCGACGAC AAAATCCCTTCCTGAGG- 3 ' 

52. SEQ ID NO: 52 Nukleinsauresequenz kodierend fur ein 

ant i s ens e-RNA Fragment der Cytosindeaminase aus 
E . col i ( codARNAi-ant i ) 

10 

53. SEQ ID NO:- 53 Oligonukleotidprimer codAS'EcoRI 

5 ' -GAATTCGGCTAACAGTGTCGAATAACG-3 ' 

54. SEQ ID NO: 54 Oligonukleotidprimer codA3'BamHI 
15 5 ' -GGATCCGAC AAAATCCCTTCCTGAGG- 3 ' 

55. SEQ ID NO: 55 Vektorkonstrukt pBluKS-nitP-STLSl-35S-T 

56. SEQ ID NO: 56 Expressionsvektor pSUN-1 

20 

57. SEQ ID NO: 57 Transgener Expressionsvektor pSUN-l-codA-RNAi 



Abb il dung en 

25 Fig.l: Inaktivierung des Markerproteingens mittels Einbringen 
einer Rekombinase 



P : Promotor 

MP: Sequenz kodierend fur ein Markerprotein 

30 R1/R2 : Rekombinase-Erkennungs sequenz en 

R: Rekombinase bzw. Sequenz kodierend fur 

Rekombinase . 



In einer bevorzugten Aus fuhrungs form wird die Inakti- 
35 vierung des Markerproteingens durch das Einbringen einer 

sequenzspezif ischen Rekombinase realisiert. Bevorzugt 
wird die Rekombinase - wie hier dargestellt - ausgehend 
von einer Expressionskassette exprimiert. 

40 Das Markerproteingen ist von Erkennungssequenzen fur 

sequenzspezif ische Rekombinasen flankiert, wobei durch 
Einbringen der Rekombinase Sequenzen des Markerprotein- 
gens deletiert werden und so eine Inaktivierung des 
Markerproteinsgens erf olgt . 



45 
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Fig.2-A: Inaktivierung des Markerproteingens durch Einwirken einer 
sequenzspezif ischen Nuklease 

P : Promo tor 

5 DS: Erkennungssequenz zur gezielten Induk- 

tion von DNA-Doppelstrangbriichen 
MP-DS-MP': Sequenz kodierend fur ein Markerprotein 

umfassend eine DS 
nDS: Inaktivierte DS 

10 E: Sequenzspezif isches Enzym zur gezielten 

Induktion von DNA-Doppelstrangbriichen 

Das Markerprotein-Gen kann durch eine gezielte Mutation 
oder Deletion im Markerprotein-Gen z.B. durch sequenz- 
spezifische Induktion von DNA-Doppelstrangbriichen an 
einer Erkennungssequenz zur gezielten Induktion von 
DNA-Doppelstrangbriichen in oder in der Nahe des Marker- 
protein-Gens (P-MP) realisiert werden. Der Doppelstrang- 
bruch kann in der kodierenden Region oder aber auch der 
nicht-kodierenden (wie beispielsweise dem Promotor) 
erfolgen, induziert eine illegitime Rekombination (nicht- 
homologe Verbindung von DNA-Enden; n non-homologous end- 
joining") und so z.B, eine Verschiebung im Leseraster des 
Markerproteins . 

B: Inaktivierung des Markerproteingens durch Einwirken einer 
sequenzspezif ischen Nuklease 



P: Promotor 

30 DS: Erkennungssequenz zur gezielten Induk- 

tion von DNA-Doppelstrangbriichen 

MP: Sequenz kodierend fur ein Markerprotein 

nDS: Inaktivierte DS 

E: Sequenzspezif isches Enzym zur gezielten 

35 Induktion von DNA-Doppelstrangbriichen 



Das Markerprotein-Gen kann durch eine gezielte Deletion 
durch sequenzspezif ische Induktion von mehr als einem 
sequenzspezif ischen DNA-Doppelstrangbruch in oder in 

40 der Nahe des Markerprotein-Gens realisiert werden. Die 

Doppelstrangbriiche konnen in der kodierenden Region 
oder aber auch der nicht-kodierenden (wie beispielsweise 
dem Promotor) erfolgen und induzieren eine Deletion im 
Markerprotein-Gen. Bevorzugt ist das Markerprotein-Gen 

45 von DS Sequenz en flankiert und wird vollstSndig durch 

Einwirken des Enzyms E deletiert. 



20 



25 

Fig. 2- 



BASF Plant: Science GmbH 20020471 



PF 53790 DE 



70 

Fig. 3: Inaktivierung des Markerprotein-Gens durch Induktion 

einer intramolekularen homologen Rekombination infolge 
des Einwirkens einer sequenzspezif ischen Nuklease 

5 A/A' : Sequenzen mit einer ausreichenden Lange 

und Homologie zueinander, um infolge des 
induzierten Doppelstrangbruch.es miteinander 
zu rekombinieren 
P: Promotor 
10 DS: Erkennungssequenz zur gezielten Induktion 

von DNA-Doppelstrangbruchen 
MP: Sequenz kodierend fur ein Markerprotein 

E: Sequenzspezif isches Enzym zur gezielten 

Induktion von DNA-Doppelstrangbruchen 

15 

Das Markerprotein-Gen kann durch eine Deletion mittels 
intramolekularen homologer Rekombination inaktiviert 
werden. Die homologe Rekombination kann durch sequenz- 
spezif ische Induktion von DNA-Doppelstrangbriichen an 

20 einer Erkennungssequenz zur gezielten Induktion von 

DNA- Doppelstrangbruchen in Oder in der Nahe des Marker- 
protein-Gens initiiert werden. Die homologe Rekombination 
erfolgt zwischen den Sequenzen A und A' , die eine aus- 
reichenden Lange und Homologie zueinander haben, um 

25 infolge des induzierten Doppelstrangbruches miteinander 

zu rekombinieren. Die Rekombination bewirkt eine Deletion 
essentieller sequenzen des Markerprotein-Gens. 

Fig. 4: Inaktivierung des Markerprotein-Gens durch intermole- 
30 kulare homologe Rekombination 

A/A' : Sequenzen mit einer ausreichenden Lange und Holomogie 

zueinander, um miteinander zu rekombinieren 
B/B' : Sequenzen mit einer ausreichenden Lange 

35 und Holomogie zueinander, um miteinander zu 

r ekombini eren 
P : Promotor 

I: zu insertierende Nukleinsauresequenz / 

Gen von Interesse 
40 MP: Sequenz kodierend fur ein Markerprotein 

Die Inaktivierung des Markerprotein-Gens (P-MP) kann auch 
durch eine gezielte Insertion in das Markerprotein-Gen 
z.B. mittels intermolekularer homologer Rekombination 
45 realisiert werden. Dabei ist die zu insertierende Region 

an ihrem 5'- und 3'-Ende von Nukleinsauresequenzen (A' 
bzw. B') flankiert, die eine ausreichende Lange und Homo- 
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logie zu entsprechenden f lankierenden Sequenzen des 
Markerproteingens (A bzw. B) aufweisen, um eine homologe 
Rekombination zwischen A und A' und B und B' zu ermog- 
lichen. Die Rekombination bewirkt eine Deletion essen- 
5 tieller sequenzen des Markerprotein-Gens. 



Fig. 5: Inakti vie rung des Markerprotein-Gens durch intermole- 
kulare homologe Rekombination infolge des Einwirkens 
einer sequenzspezif ischen Nuklease 



10 



A/A' : Sequenzen mit einer ausreichenden Lange und 

Holomogie zueinander, um miteinander zu 
rekombinieren 

B/B' : Sequenzen mit einer ausreichenden Lange 

15 und Holomogie zueinander, um miteinander zu 

rekombinieren 

P: Promo tor 

Is zu insertierende Nukleinsauresequenz / 

Gen von Interesse 
20 MP: Sequenz kod.ierend fur ein Markerprotein 

DS: Erkennungs sequenz zur gezielten Induktion 

von DNA-Doppelstrangbruchen 
E: Sequenzspzifisches Enzym zur gezielten 

Induktion von DNA-Doppelstrangbriichen 

25 

Die Inaktivierung des Markerprotein-Gens kann auch durch 
eine gezielte Insertion in das Markerprotein-Gen z.B. 
mittels intermolekularer homologer Rekombination reali- 
siert werden. Die homologe Rekombination kann durch 

30 sequenzspezif ische Induktion von DNA-Doppelstrangbriichen 

an einer Erkennungs sequenz zur gezielten Induktion von 
DNA-Doppelstrangbriichen in oder in der Nahe des Marker- 
protein-Gens initiiert werden. Dabei ist die zu inser- 
tierende Region an ihrem 5'- und 3'-Ende von Nuklein- 

35 sauresequenzen (A' bzw. B') flankiert, die eine aus- 

reichende Lange und Homologie zu entsprechenden f lan- 
kierenden Sequenzen des Markerprotein-Gens (A bzw. B) 
aufweisen, um eine homologe Rekombination zwischen A und 
A' und B und B' zu ermoglichen. Die Rekombination bewirkt 

40 eine Deletion essentieller sequenzen des Markerprotein- 

Gens . 



45 
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Fig. 6: Vektorkarte fur pBluKS-nitP-STLSl-35S-T (SEQ ID NO: 55) 

NitP: Promoter des Nitrilasel-Gens aus A.thaliana (Gen- 
Bank Acc.-No.: Y07648.2, Hillebrand et al . (1996) Gene 
5 170:197-200) 

STLS-1 Intron: Intron des ST-LS1 Gens aus Kartoffel (Van- 
canneyt GF et al. (1990) Mol Gen Genet 220 (2) :245-250) . 

10 35S-Term: Terminator des 35S CaMV Gens (Blumenkohlmosaik- 

virus; Franck et al. (1980) Cell 21:285-294). 

Schnittstellen relevanter Restriktionsendonukleasen sind 
mit ihrer jeweiligen Schnittposition angegeben 

15 

Fig. 7: Vektorkarte fur den transgenen Express ions vektor 
pSUN-l-codA-RNAi (SEQ ID NO: 57) 

NitP: Promotor des Nitrilasel-Gens aus A.thaliana (Gen- 
20 Bank Acc.-No. : Y07648.2, Hillebrand et al . (1996) Gene 

170:197-200) 



STLS-1 Intron: Intron des ST-LS1 Gens aus Kartoffel (Van- 
canneyt GF et al . (1990) Mol Gen Genet 220 (2) .-245-250) . 

35S-Term: Terminator des 35S CaMV Gens (Blumenkohlmosaik- 
virus; Franck et al . (1980) Cell 21:285-294). 

codA-sense: Nukleinsauresequenz kodierend fur ein sense- 
RNA Fragment der Cytosindeaminase aus E.coli (codARNAi- 
sense; SEQ ID NO: 49) 

codA-anti: Nukleinsauresequenz kodierend fur ein anti- 
sense-RNA Fragment der Cytosindeaminase aus E.coli 
(codARNAi-anti; SEQ ID NO: 52) 

LB/RB: Linke bzw. rechte Grenze der Agrobacterium T-DNA 

Schnittstellen relevanter Restriktionsendonukleasen sind 
mit ihrer jeweiligen Schnittposition angegeben. Weitere 
Elemente stellen ubliche Elemente eines binaren Agro- 
bakterium-Vektors dar (aadA; ColEl; repA) 



45 
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Ausfuhrungsbeispiele 

Allgemeine Methoden 

5 Die chemische Synthese von Oligonukleotiden kann beispielsweise, 
in bekannter Weise, nach der Phosphoamiditmethode (Voet, Voet, 
2. Auflage, Wiley Press New York, Seite 896-897) erfolgen. Die 
im Rahmen der vorliegenden Erfindung durchgefiihrten Klonierungs- 
schritte wie z.B. Restriktionsspaltungen, Agarosegelelektro- 

10 phorese, Reinigung von DNA-Fragmenten , Transfer von Nukleinsauren 
auf Nitrozellulose und Nylonmembranen, Verkniipfen von DNA-Frag- 
menten, Transformation von E . coli Zellen, Anzucht von Bakterien, 
Vermehrung von Phagen und Sequenz analyse rekombinanter DNA 
werden wie bei Sambrook et al. (1989) Cold Spring Harbor 

•15 Laboratory Press; ISBN 0-87969-309-6 beschrieben durchgefuhrt . 
Die Sequenzierung rekombinanter DNA-Molekiile erfolgt mit einem 
Laserf luoreszenz-DNA-Sequenzierer der Firma ABI nach der Methode 
von Sanger (Sanger et al . (1977) Proc Natl Acad Sci 
USA 74:5463-5467) . 

20 

Beispiel 1: Herstellung der codA-Fragmente 

Zunachst wird eine verkurzte und am 5' bzw. 3' Ende durch 
Addition von Er kennungs s equenz en der Restriktionsenzyme Hindlll 

25 und Sail modifizierte Nukleinsaurevariante des codA Gens unter 
Verwendung der PCR-Technologie hergestellt. Dazu wird ein Teil 
des codA Gens (GeneBank Acc.-No.: S56903; SEQ ID NO: 1) mittels 
Polymerasekettenreaktion (PCR) aus dem Herkunf tsorganismus E.coli 
unter Verwendung eines sense-spezif ischen Primers (codA5 ' Hindlll ; 

30 SEQ ID NO: 50) und eines antisense-spezif ischen Primers 
(codA3'SalI; SEQ ID NO: 51) amplif iziert . 

codA5' Hindlll: 5 ' -AAGCTTGGCTAACAGTGTCGAATAACG-3 ' (SEQ ID NO : 50) 
35 codA3'SalI: 5 ' -GTCGACGACAAAATCCCTTCCTGAGG-3 ' (SEQ ID NO: 51) 

Die PCR erfolgt in einem 50 \il Reaktionsansatz in dem en thai ten 



sind: 
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2 ^il (200 ng) genomische DNA von E.coli 

0,2 mM dATP, dTTP, dGTP, dCTP 

1,5 mM Mg(OAc) 2 

5 |iig Rinder serum- Albumin 

40 pmol Primer w codA5 'Hindlll" 

40 pmol Primer codA3'SalI 

15 ill 3 f 3x rTth DNA Polymerase XLPuffer (PE Applied 
Biosys terns) 

5U rTth DNA Polymerase XL (PE Applied Biosys terns) 
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Die PCR wird unter f olgenden Zyklus-Bedingungen durchgefiihrt : 

Schritt 1: 5 Minuten 94°C (Denaturierung) 

Schritt 2: 3 Sekunden 94°C 

5 Schritt 3: 1 Minute 60°C (Annealing) 

Schritt 4: 2 Minuten 72°C (Elongation) 

30 Wiederholungen der Schritte 2 bis 4 



10 Schritt 5: 10 Minuten 72°C (Post-Elongation) 

Schritt 6: 4°C (Warteschleif e) 

Das Amplifikat (codARNAi-sense; SEQ ID NO: 49) wird unter Ver- 
wendung von Standardmethoden in den PCR Klonierungsvektor pGEM-T 
15 (Promega) kloniert. Die Identitat des erzeugten Amplikons wird 
durch Sequenzierung unter Verwendung des M13F (-40) Primers 
bestatigt. 

Ein weiteres verkurztes und am 5'- bzw. 3'-Ende durch Addition 
20 von Erkennungssequenzen der Restriktionsenzyme EcoRI und BamHI 
modifiziertes Fragment des codA Gens wird mittels Polymerase- 
kettenreaktion (PCR) aus E.coli unter Verwendung eines sense- 
spezifischen Primers (codAS 'EcoRI; SEQ ID NO: 53) und eines 
antisense-spezifischen Primers (codA3 'BamHI; SEQ ID NO: 54) 
25 amplifiziert . 



codA5 ' EcoRI : 5 ' -GAATTCGGCTAACAGTGTCGAATAACG-3 ' (SEQ ID NO: 53) 
codA3' BamHI: 5 ' -GGATCCGACAAAATCCCTTCCTGAGG-3 ' (SEQ ID NO* 54) 

30 

Die PCR erfolgt in einem 50 [il Reaktionsansatz in dem enthalten 
sind: 

2 \il (200 ng)genomische DNA von E.coli 
0,2 mM dATP, dTTP, dGTP, dCTP 
35 - 1, 5 mM Mg(0Ac) 2 

5 Jllcr Rinder serum- Albumin 

40 pmol Primer w codA5 ' EcoRI " 

40 pmol Primer * codA3 ' BamHI " 

15 111 3,3x rTth DNA Polymerase XLPuffer (PE Applied 
40 Biosystems) 

5U rTth DNA Polymerase XL (PE Applied Biosystems) 



45 



BASF Plant Science GmbH 20020471 PF 53790 DE 



75 

Die PCR wird unter folgenden Zyklus Bedingungen durchgef iihrt : 

Schritt 1: 5 Minuten 94°C (Denaturierung) 

Schritt 2 : 3 Sekunden 94°C 

5 Schritt 3: 1 Minute 60°C (Annealing) 

Schritt 4: 2 Minuten 72°C (Elongation) 

30 Wiederholungen der Schritte 2 bis 4 

10 Schritt 5: 10 Minuten 72°C (Post-Elongation) 

Schritt 6: 4°C (Warteschleif e) 

Das Amplifikat (codARNAi-anti ; SEQ ID NO: 52) wird unter Ver- 
wendung von Standardmethoden in den PCR Klonierungsvektor pGEM-T 
15 (Promega) kloniert. Die Identitat des erzeugten Amplikons wird 
durch Sequenzierung unter Verwendung des M13F (-40) Primers 
bestatigt . 

Beispiel 2 Herstellung des transgenen Express ions verkt or s 
20 zur Expression einer codA doppelstrangigen RNA 

Die in Beispiel 1 generierten codA-Fragmente werden zur Her- 
stellung eines DNA Konstruktes geeignet zur Expression einer 
doppelstrangigen codA-RNA verwendet (pSUN-codA-RNAi) . Das 

25 Konstrukt ist geeignet zur Reduktion der RNA FlieSgleichgewichts- 
menge (RNA-stady state level) des codA Gens in transgenen 
Pflanzen und einer daraus resultierenden Unterdruckung der 
Expression des codA Gens unter Verwendung der „doublestrand RNA 
interference" (dsRNAi) Technologie. Die codA RNAi Kassette wird 

30 dazu zunachst in dem Plasmid pBluKS-nitP-STLSl-35S-T aufgebaut 

und anschlieSend in einem weiteren Klonierungsschritt vollstandig 
in das pSUN-1 Plasmid uberfuhrt. 

Der Vektor pBluKS-nitP-STLSl-35S-T (SEQ ID NO: 55) ist ein 
35 Deri vat des pBluescript KS (Stratagene) und en thai t den Promo tor 
des Nitrilasel-Gens aus A.thaliana (GenBank Acc.-No.: Y07648.2, 
Nukleotide 2456 bis 4340, Hillebrand et al . (1996) Gene 
170:197-200), das STLS-1 Intron (Vancanneyt GF et al. (1990) Mol 
Gen Genet 220 (2) :245-250) , Restriktionsschnittstellen die das 
40 Intron an der 5'- bzw. 3'-Seite flankieren und eine gerichtete 
Insertion von DNA Fragmenten ermoglichen, sowie den Terminator 
des 35S CaMV Gens (Blumenkohlmosaikvirus ; Franck et al. (1980) 
Cell 21:285-294). Unter Verwendung dieser Restriktionsschnitt- 
stellen (Hindlll, Sail, EcoRI, BamHI) werden die Fragmente codAR- 
45 NAi-sense (SEQ ID NO: 49) und codARNAi-anti (SEQ ID NO: 52) in 
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diesen Vektor inseriert, wodurch die fertige codA RNAi Kassette 
entsteht . 

Zu diesem Zweck wird zunachst das codA-sense Fragment (codARNAi- 
5 sense SEQ ID NO: 49) unter Verwendung der Enzyme Hindlll und Sail 
aus dem pGEM-T Vektor herausgeschnitten, isoliert und in den 
pBluKS-nitP-STLSl-35S-T Vektor unter Standardbedingungen ligiert. 
Dieser Vektor wurde im Vorfeld unter Verwendung der Restriktions- 
enzyme Hindlll und Sail geschnitten. Entsprechend positive Klone 
10 werden durch analytischen Restriktionsverdau und Sequenzierung 
identif iziert . 

Der entstandene Vektor (pBluKS-nitP-codAsense-STLSl-35S-T) wird 
unter Verwendung der Restriktionsenzyme BamHI und EcoRI verdaut. 

15 Das codA-anti Fragment (codARNAi-anti; SEQ ID NO: 52) wird aus 
dem entsprechenden pGEM-T Vektor mit BamHI und EcoRI heraus- 
geschnitten, isoliert und in den geschnittenen Vektor unter 
Standardbedingungen ligiert. Entsprechend positive Klone, welche 
die vollstandige codA-RNAi Kassette enthalten (pBluKS-nitP- 

20 codAsense~STLSl-codAanti-3 5S-T) , werden durch analytischen 
Restriktionsverdau und Sequenzierung identif iziert . 

Der Transfer der codA-RNAi Kassette in den pSUN-1 Vektor 
(SEQ ID NO: 56) erfolgt unter Verwendung der die Kassette 

25 flankierenden Restriktionsschnitt-stellen SacI und Kpnl . Der 

entstandene Vektor pSUNl-codA-RNAi (siehe Fig. 7; SEQ ID NO: 57) 
wird zur Transformation von transgenen A.thallema. Pflanzen 
verwendet, die ein aktives codA Gen exprimieren (s.u.). Der 
Pf lanz enexpr e s s ions - Vektor pSUN-1 ist im Rahmen des erfindungs- 

30 gemaSen Verfahrens besonders geeignet, da er keinen weiteren 
positiven Selektionsmarker tragt. 

Der entstandene Vektor pSUNl -codA-RNAi ermoglicht die konsti- 
tutive Expression einer artif iziellen codA-dsRNA Variante, 

35 bestehend aus zwei identischen Nukleinsaureelementen, die durch 
ein Intron getrermt, in invert ierter Form zueinander vorliegen. 
In Folge der Transkription dieser artif iziellen codA-dsRNA 
Variante kommt es aufgrund der Komplementaritat der invertierten 
Nukleinsaureelemente zur Ausbildung eines doppelstrangigen RNA 

40 Molekiils. Das Vorhandensein dieses Molekuls induziert die Unter- 
drackung der Expression (RNA Akkumulation) des codA Gens mittels 
^double strand RNA interference" . 
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Beispiel 4: Herstellung transgener Arabidopis thaliana Pflanzen 

Transgene Arabidopsis thaliana Pflanzen, die als Markerprotein 
das codA Gen aus E.coli transgen exprimieren ( "A. thaliana- 
5 [codA]")/ wurden hergestellt wie beschrieben (Kirik et al. (2000) 
EMBO J 19 (20) : 5562-6) . 

Die A. thaliana- [codA] Pflanzen werden mit einem Agrobacterium 
tumefaciens Stainm (GV3101 [pMP90] ) auf Grundlage einer modifi- 

10 zierten Vakuuminf iltrationsmethode transformiert (Clough S & Bent 
A (1998) Plant J 16 ( 6) : 735-43 ; Bechtold N et al . (1993) CR Acad 
Sci Paris 1144 (2) : 204-212 ) . Die verwendeten Agrobacterium tume- 
faciens Zellen werden im Vorfeld mit dem beschriebenen DNA— 
Konstrukt (pSUNl-codA-RNAi ) transformiert. Auf diese Art werden 

15 doppelt-transgene A. thaliana- [codA] Pflanzen erzeugt, die unter 
Kontrolle des konstitutiven Nitrilasel-Promotors eine arti- 
fizielle codA-doppelstrangige RNA exprimieren. Als Folge des 
durch die Anwesenheit dieser artif iziellen codA-dsRNA induzierten 
dsRNAi-Ef fektes wird die Expression des codA Gens unterdruckt. 

20 Diese doppelt-transgenen Pflanzen konnen aufgrund ihrer wieder- 
gewonnen Fahigkeit, in Anwesenheit von 5-Fluorocytosin im Kultur- 
medium zu wachsen, identif iziert werden. 

Samen der Primartransf ormanden werden auf Grundlage der wieder- 
25 gewonnenen Fahigkeit in Anwesenheit von 5-Fluorcytosin zu wachsen 
selektioniert . Zu diesem Zweck werden die Tl Samen der Primar- 
transf ormanden auf Selektionsmedium ausgelegt welches 2 00 fig/ml 
5-Fluorocytosin enthalt. Diese Selektionsplatten werden unter 
Langtagbedingxingen (16 Std. Licht, 21°C/8 Std. Dunkel, 18°C) inku- 
30 biert. Keimlinge, die sich in Anwesenheit von 5-Flourocytosin 
normal entwickeln # werden nach 7 Tagen separiert und auf neue 
Selektionsplatten transf eriert . Diese Platten werden bei unver- 
anderten Bedingungen fur weitere 14 inkubiert. Anschliefeend 
werden die resistenten Keimlinge in Erde pikiert und unter Kurz- 
35 tagbedingungen (8 Std. Licht, 21°C/16 Std. Dunkel, 18°C) kulti- 
viert. Nach 14 Tagen werden die jungen Pflanzen in das Gewachs- 
haus transf eriert und unter Kurztagbedingungen kultiviert. 
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Neue' Selektionsverfahren 1©/ 522341 

Zusammenf as sung 

5 

Die vorliegende Erfindung betrifft Verfahren zur Herstellung 
transformierter pf lanzlicher Zellen oder Organismen durch Trans- 
formation einer Population pf lanzlicher Zellen, die mindestens 
ein Markerprotein mit einem fur diese direkt oder indirekt 

10 toxischen Effekt umfasst, mit mindestens einer zu insertierenden 
Nukleinsauresequenz in Kombination mit mindestens einer Ver- 
bindung - bevorzugt einem DNA-Konstrukt - befahigt zur Ver- 
minderung der Expression, Menge, Aktivitat und/oder Funktion des 
Markerproteins , wobei die transf ormierten pflanzlichen Zellen 

15 infolge der Wirkung besagter Verbindung gegenuber nicht-trans- 
f ormierten Zellen einen Wachs turns vorteil haben. 
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SEQUENZ PROTOKOLL 

<110> BASF Plant Science GmbH 

<120> Neue Selektionssysteme 

<130> AE20020471 

<140> 
<141> 

<160> 57 

<170> Patentln Ver. 2.1 

<210> 1 
<211> 1284 
<212> DNA 

<213> Escherichia coli 

<220> 

<221> CDS 

<222> (1) . . (1281) 

<223> coding for cytosine deaminase (codA) 
<400> 1 

gtg teg aat aac get tta caa aca att att aac gec egg tta cca ggc 48 
Val Ser Asn Asn Ala Leu Gin Thr He He Asn Ala Arg Leu Pro Gly 
15 10 15 

gaa gag ggg ctg tgg cag att cat ctg cag gac gga aaa ate age gee 96 
Glu Glu Gly Leu Trp Gin He His Leu Gin Asp Gly Lys He Ser Ala 
20 25 30 

att gat gcg caa tec ggc gtg atg ccc ata act gaa aac age ctg gat 144 
He Asp Ala Gin Ser Gly Val Met Pro He Thr Glu Asn Ser Leu Asp 
35 40 45 

gec gaa caa ggt tta gtt ata ccg ccg ttt gtg gag cca cat att cac 192 
Ala Glu Gin Gly Leu Val He Pro Pro Phe Val Glu Pro His He His 
50 55 60 

ctg gac acc acg caa acc gec gga caa ccg aac tgg aat cag tec ggc 240 
Leu Asp Thr Thr Gin Thr Ala Gly Gin Pro Asn Trp Asn Gin Ser Gly 
65 70 75 80 

acg ctg ttt gaa ggc att gaa cgc tgg gec gag cgc aaa gcg tta tta 2 88 
Thr Leu Phe Glu Gly He Glu Arg Trp Ala Glu Arg Lys Ala Leu Leu 

85 90 95 

acc cat gac gat gtg aaa caa cgc gca tgg caa acg ctg aaa tgg cag 33 6 
Thr His Asp Asp Val Lys Gin Arg Ala Trp Gin Thr Leu Lys Trp Gin 
100 105 110 

att gec aac ggc att cag cat gtg cgt acc cat gtc gat gtt teg gat 384 
He Ala Asn Gly He Gin His Val Arg Thr His Val Asp Val Ser Asp 
115 120 125 

gca acg eta act gcg ctg aaa gca atg ctg gaa gtg aag cag gaa gtc 432 
Ala Thr Leu Thr Ala Leu Lys Ala Met Leu Glu Val Lys Gin Glu Val 
130 135 140 

gcg ccg tgg att gat ctg caa ate gtc gee ttc cct cag gaa ggg att 480 
Ala Pro Trp He Asp Leu Gin He Val Ala Phe Pro Gin Glu Gly He 
145 150 155 160 

ttg teg tat ccc aac ggt gaa gcg ttg ctg gaa gag gcg tta cgc tta 52 8 
Leu Ser Tyr Pro Asn Gly Glu Ala Leu Leu Glu Glu Ala Leu Arg Leu 
165 170 175 
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ggg gca gat gta gtg ggg gcg att ccg cat ttt gaa ttt acc cgt gaa 576 
Gly Ala Asp Val Val Gly Ala lie Pro His Phe Glu Phe Thr Arg Glu 
180 185 190 

tac ggc gtg gag teg ctg cat aaa acc ttc gec ctg gcg caa aaa tac 624 
Tyr Gly Val Glu Ser Leu His Lys Thr Phe Ala Leu Ala Gin Lys Tyr 
195 200 205 

gac cgt etc ate gac gtt cac tgt gat gag ate gat gac gag cag teg 672 
Asp Arg Leu lie Asp Val His Cys Asp Glu He Asp Asp Glu Gin Ser 
210 215 220 

cgc ttt gtc gaa acc gtt get gee ctg gcg cac cat gaa ggc atg ggc 720 
Arg Phe Val Glu Thr Val Ala Ala Leu Ala His His Glu Gly Met Gly 
225 230 235 240 

gcg cga gtc acc gee age cac acc acg gca atg cac tec tat aac ggg 7 68 
Ala Arg Val Thr Ala Ser His Thr Thr Ala Met His Ser Tyr Asn Gly 
245 250 255 

gcg tat acc tea cgc ctg ttc cgc ttg ctg aaa atg tec ggt att aac 816 
Ala Tyr Thr Ser Arg Leu Phe Arg Leu Leu Lys Met Ser Gly He Asn 
260 265 270 

ttt gtc gee aac ccg ctg gtc aat att cat ctg caa gga cgt ttc gat 8 64 
Phe Val Ala Asn Pro Leu Val Asn He His Leu Gin Gly Arg Phe Asp 
275 280 285 

acg tat cca aaa cgt cgc ggc ate acg cgc gtt aaa gag atg ctg gag 912 
Thr Tyr Pro Lys Arg Arg Gly He Thr Arg Val Lys Glu Met Leu Glu 
290 295 300 

tec ggc att aac gtc tgc ttt ggt cac gat gat gtc ttc gat ccg tgg 960 
Ser Gly He Asn Val Cys Phe Gly His Asp Asp Val Phe Asp Pro Trp 
305 310 315 320 

tat ccg ctg gga acg gcg aat atg ctg caa gtg ctg cat atg ggg ctg 1008 
Tyr Pro Leu Gly Thr Ala Asn Met Leu Gin Val Leu His Met Gly Leu 
325 330 335 

cat gtt tgc cag ttg atg ggc tac ggg cag att aac gat ggc ctg aat 1056 
His Val Cys Gin Leu Met Gly Tyr Gly Gin He Asn Asp Gly Leu Asn 
340 345 350 

tta ate acc cac cac age gca agg acg ttg aat ttg cag gat tac ggc 1104 
Leu He Thr His His Ser Ala Arg Thr Leu Asn Leu Gin Asp Tyr Gly 
355 360 365 

att gee gee gga aac age gee aac ctg att ate ctg ccg get gaa aat 1152 
He Ala Ala Gly Asn Ser Ala Asn Leu He He Leu Pro Ala Glu Asn 
370 375 380 

ggg ttt gat gcg ctg cgc cgt cag gtt ccg gta cgt tat teg gta cgt 12 00 
Gly Phe Asp Ala Leu Arg Arg Gin Val Pro Val Arg Tyr Ser Val Arg 
385 390 • 395 400 

ggc ggc aag gtg att gee age aca caa ccg gca caa acc acc gta tat 1248 
Gly Gly Lys Val He Ala Ser Thr Gin Pro Ala Gin Thr Thr Val Tyr 
405 410 415 

ctg gag cag cca gaa gee ate gat tac aaa cgt tga 1284 
Leu Glu Gin Pro Glu Ala He Asp Tyr Lys Arg 
420 425 

<210> 2 
<211> 427 
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<212> PRT 
<213> Escherichia coli 

<400> 2 

Val Ser Asn Asn Ala Leu Gin Thr lie lie Asn Ala Arg Leu Pro Gly 
15 10 15 

Glu Glu Gly Leu Trp Gin lie His Leu Gin Asp Gly Lys He Ser Ala 
20 25 30 

He Asp Ala Gin Ser Gly Val Met Pro He Thr Glu Asn Ser Leu Asp 
35 40 45 

Ala Glu Gin Gly Leu Val He Pro Pro Phe Val Glu Pro His He His 
50 55 60 

Leu Asp Thr Thr Gin Thr Ala Gly Gin Pro Asn Trp Asn Gin Ser Gly 
65 70 75 80 

Thr Leu Phe Glu Gly He Glu Arg Trp Ala Glu Arg Lys Ala Leu Leu 

85 90 95 

Thr His Asp Asp Val Lys Gin Arg Ala Trp Gin Thr Leu Lys Trp Gin 
100 105 110 

He Ala Asn Gly He Gin His Val Arg Thr His Val Asp Val Ser Asp 
115 120 125 

Ala Thr Leu Thr Ala Leu Lys Ala Met Leu Glu Val Lys Gin Glu Val 
130 135 140 

Ala Pro Trp He Asp Leu Gin He Val Ala Phe Pro Gin Glu Gly He 
145 150 155 160 

Leu Ser Tyr Pro Asn Gly Glu Ala Leu Leu Glu Glu Ala Leu Arg Leu 
165 170 175 

Gly Ala Asp Val Val Gly Ala He Pro His Phe Glu Phe Thr Arg Glu 
180 185 190 

Tyr Gly Val Glu Ser Leu His Lys Thr Phe Ala Leu Ala Gin Lys Tyr 
195 200 205 

Asp Arg Leu He Asp Val His Cys Asp Glu He Asp Asp Glu Gin Ser 
210 215 220 

Arg Phe Val Glu Thr Val Ala Ala Leu Ala His His Glu Gly Met Gly 
225 230 235 240 

Ala Arg Val Thr Ala Ser His Thr Thr Ala Met His Ser Tyr Asn Gly 
245 250 ^ 255 

Ala Tyr Thr Ser Arg Leu Phe Arg Leu Leu Lys Met Ser Gly He Asn 
260 265 270 

Phe Val Ala Asn Pro Leu Val Asn He His Leu Gin Gly Arg Phe Asp 
275 280 285 

Thr Tyr Pro Lys Arg Arg Gly He Thr Arg Val Lys Glu Met Leu Glu 
290 295 300 

Ser Gly He Asn Val Cys Phe Gly His Asp Asp Val Phe Asp Pro Trp 
305 310 315 ~ 320 

Tyr Pro Leu Gly Thr Ala Asn Met Leu Gin Val Leu His Met Gly Leu 
325 330 335 

His Val Cys Gin Leu Met Gly Tyr Gly Gin He Asn Asp Gly Leu Asn 
340 345 350 
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Ser 
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410 
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Gin 
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Val 
415 
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Leu 


Glu 
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Pro 
420 


Glu 


Ala 


He 


Asp 


Tyr 
425 


Lys 
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<210> 3 
<211> 1284 
<212> DNA 

<213> Ktinstliche Sequenz 
<220> 

<223> Beschreibung der 'ktinst lichen Sequenz: coding for 
cytosine deaminase (codA) 

<220> 

<221> misc_f eature 
<222> (1) . . (3) 

<223> mutation of GTG to ATG start codon for expression 
in eucaryotic hosts 

<220> 
<221> CDS 
<222> (1) . . (1281) 

<223> coding for cytosine deaminase (codA) 
<400> 3 

atg teg aat aac get tta caa aca att att aac gec egg tta cca ggc 48 
Met Ser Asn Asn Ala Leu Gin Thr He He Asn Ala Arg Leu Pro Gly 

15 10 15 

gaa gag ggg ctg tgg cag att cat ctg cag gac gga aaa ate age gee 
Glu Glu Gly Leu Trp Gin He His Leu Gin Asp Gly Lys He Ser Ala 

20 25 3 0 

att gat gcg caa tec ggc gtg atg ccc ata act gaa aac age ctg gat 
He Asp Ala Gin Ser Gly Val Met Pro He Thr Glu Asn Ser Leu Asp 

35 40 45 

gee gaa caa ggt tta gtt ata ccg ccg ttt gtg gag cca cat att cac 
Ala Glu Gin Gly Leu Val He Pro Pro Phe Val Glu Pro His He His 

50 55 60 

ctg gac ace acg caa ace gee gga caa ccg aac tgg aat cag tec ggc 
Leu Asp Thr Thr Gin Thr Ala Gly Gin Pro Asn Trp Asn Gin Ser Gly 
65 70 75 80 

acg ctg ttt gaa ggc att gaa cgc tgg gee gag cgc aaa gcg tta tta 
Thr Leu Phe Glu Gly He Glu Arg Trp Ala Glu Arg Lys Ala Leu Leu 

85 90 95 

ace cat gac gat gtg aaa caa cgc gca tgg caa acg ctg aaa tgg cag 3 36 
Thr His Asp Asp Val Lys Gin Arg Ala Trp Gin Thr Leu Lys Trp Gin 

100 105 110 

att gec aac ggc att cag cat gtg cgt ace cat gtc gat gtt teg gat 
He Ala Asn Gly He Gin His Val Arg Thr His Val Asp Val Ser Asp 
115 ~ 120 125 
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gca acg eta act gcg ctg aaa gca atg ctg gaa gtg aag cag gaa gtc 432 
Ala Thr Leu Thr Ala Leu Lys Ala Met Leu Glu Val Lys Gin Glu Val 

130 135 140 

gcg ccg tgg att gat ctg caa ate gtc gec ttc cct cag gaa ggg att 480 
Ala Pro Trp He Asp Leu Gin lie Val Ala Phe Pro Gin Glu Gly He 
145 150 155 160 

ttg teg tat ccc aac ggt gaa gcg ttg ctg gaa gag gcg tta cgc tta 528 
Leu Ser Tyr Pro Asn Gly Glu Ala Leu Leu Glu Glu Ala Leu Arg Leu 
165 170 175 

ggg gca gat gta gtg ggg gcg att ccg cat ttt gaa ttt acc cgt gaa 576 
Gly Ala Asp Val Val Gly Ala He Pro His Phe Glu Phe Thr Arg Glu 
180 185 190 

tac ggc gtg gag teg ctg cat aaa acc ttc gee ctg gcg caa aaa tac 624 
Tyr Gly Val Glu Ser Leu His Lys Thr Phe Ala Leu Ala Gin Lys Tyr 
195 200 205 

gac cgt etc ate gac gtt cac tgt gat gag ate gat gac gag cag teg 672 
Asp Arg Leu lie Asp Val His Cys Asp Glu He Asp Asp Glu Gin Ser 
210 215 220 

cgc ttt gtc gaa acc gtt get gee ctg gcg cac cat gaa ggc atg ggc 720 
Arg Phe Val Glu Thr Val Ala Ala Leu Ala His His Glu Gly Met Gly 
225 230 235 240 

gcg cga gtc acc gee age cac acc acg gca atg cac tec tat aac ggg 768 
Ala Arg Val Thr Ala Ser His Thr Thr Ala Met His Ser Tyr Asn Gly 
245 250 255 

gcg tat acc tea cgc ctg ttc cgc ttg ctg aaa atg tec ggt att aac 816 
Ala Tyr Thr Ser Arg Leu Phe Arg Leu Leu Lys Met Ser Gly He Asn 
260 265 270 

ttt gtc gee aac ccg ctg gtc aat att cat ctg caa gga cgt ttc gat 864 
Phe Val Ala Asn Pro Leu Val Asn He His Leu Gin Gly Arg Phe Asp 
275 280 285 

acg tat cca aaa cgt cgc ggc ate acg cgc gtt aaa gag atg ctg gag 912 
Thr Tyr Pro Lys Arg Arg Gly He Thr Arg Val Lys Glu Met Leu Glu 
290 295 300 

tec ggc att aac gtc tgc ttt ggt cac gat gat gtc ttc gat ccg tgg 960 
Ser Gly He Asn Val Cys Phe Gly His Asp Asp Val Phe Asp Pro Trp 
305 310 315 320 

tat ccg ctg gga acg gcg aat atg ctg caa gtg ctg cat atg ggg ctg 1008 
Tyr Pro Leu Gly Thr Ala Asn Met Leu Gin Val Leu His Met Gly Leu 
325 330 335 

cat gtt tgc cag ttg atg ggc tac ggg cag att aac gat ggc ctg aat 1056 
His Val Cys Gin Leu Met Gly Tyr Gly Gin He Asn Asp Gly Leu Asn 
340 345 350 

tta ate acc cac cac age gca agg acg ttg aat ttg cag gat tac ggc 1104 
Leu He Thr His His Ser Ala Arg Thr Leu Asn Leu Gin Asp Tyr Gly 
355 360 365 

att gee gee gga aac age gee aac ctg att ate ctg ccg get gaa aat 1152 
He Ala Ala Gly Asn Ser Ala Asn Leu He He Leu Pro Ala Glu Asn 
370 375 380 

ggg ttt gat gcg ctg cgc cgt cag gtt ccg gta cgt tat teg gta cgt 1200 
Gly Phe Asp Ala Leu Arg Arg Gin Val Pro Val Arg Tyr Ser Val Arg 
385 390 395 400 
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ggc ggc aag gtg att gcc age aca caa ccg gca caa acc acc gta tat 1248 
Gly Gly Lys Val He Ala Ser Thr Gin Pro Ala Gin Thr Thr Val Tyr 
405 410 415 

ctg gag cag cca gaa gcc ate gat tac aaa cgt tga 1284 
Leu Glu Gin Pro Glu Ala He Asp Tyr Lys Arg 
420 425 

<210> 4 
<211> 427 
<212> PRT 

<213> Kiinstliche Sequenz 

<223> Beschreibung der kiinstlichen Sequenz: coding for 
cytosine deaminase (codA) 

<400> 4 

Met Ser Asn Asn Ala Leu Gin Thr He He Asn Ala Arg Leu Pro Gly 
15 10 15 

Glu Glu Gly Leu Trp Gin He His Leu Gin Asp Gly Lys He Ser Ala 
20 25 30 

He Asp Ala Gin Ser Gly Val Met Pro He Thr Glu Asn Ser Leu Asp 
35 40 45 

Ala Glu Gin Gly Leu Val He Pro Pro Phe Val Glu Pro His He His 
50 55 60 

Leu Asp Thr Thr Gin Thr Ala Gly Gin Pro Asn Trp Asn Gin Ser Gly 
65 70 75 80 

Thr Leu Phe Glu Gly He Glu Arg Trp Ala Glu Arg Lys Ala Leu Leu 

85 90 95 

Thr His Asp Asp Val Lys Gin Arg Ala Trp Gin Thr Leu Lys Trp Gin 
100 105 110 

He Ala Asn Gly He Gin His Val Arg Thr His Val Asp Val Ser Asp 
115 120 125 

Ala Thr Leu Thr Ala Leu Lys Ala Met Leu Glu Val Lys Gin Glu Val 
130 135 140 

Ala Pro Trp He Asp Leu Gin He Val Ala Phe Pro Gin Glu Gly He 
145 150 155 160 

Leu Ser Tyr Pro Asn Gly Glu Ala Leu Leu Glu Glu Ala Leu Arg Leu 
165 170 175 

Gly Ala Asp Val Val Gly Ala He Pro His Phe Glu Phe Thr Arg Glu 
180 185 190 

Tyr Gly Val Glu Ser Leu His Lys Thr Phe Ala Leu Ala Gin Lys Tyr 
195 200 205 

Asp Arg Leu He Asp Val His Cys Asp Glu He Asp Asp Glu Gin Ser 
210 215 220 

Arg Phe Val Glu Thr Val Ala Ala Leu Ala His His Glu Gly Met Gly 
225 230 235 240 

Ala Arg Val Thr Ala Ser His Thr Thr Ala Met His Ser Tyr Asn Gly 
245 250 255 

Ala Tyr Thr Ser Arg Leu Phe Arg Leu Leu Lys Met Ser Gly He Asn 
260 265 270 

Phe Val Ala Asn Pro Leu Val Asn He His Leu Gin Gly Arg Phe Asp 
275 280 285 
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Thr Tyr Pro Lys Arg Arg Gly lie Thr Arg Val Lys Glu Met Leu Glu 
290 " 295 300 

Ser Gly He Asn Val Cys Phe Gly His Asp Asp Val Phe Asp Pro Trp 
305 "* 310 315 320 

Tyr Pro Leu Gly Thr Ala Asn Met Leu Gin Val Leu His Met Gly Leu 
325 330 335 

His Val Cys Gin Leu Met Gly Tyr Gly Gin He Asn Asp Gly Leu Asn 
340 345 350 

Leu He Thr His His Ser Ala Arg Thr Leu Asn Leu Gin Asp Tyr Gly 
355 360 365 

He Ala Ala Gly Asn Ser Ala Asn Leu He He Leu Pro Ala Glu Asn 
370 375 380 

Gly Phe Asp Ala Leu Arg Arg Gin Val Pro Val Arg Tyr Ser Val Arg 
385 390 395 400 

Gly Gly Lys Val He Ala Ser Thr Gin Pro Ala Gin Thr Thr Val Tyr 
405 410 415 

Leu Glu Gin Pro Glu Ala He Asp Tyr Lys Arg 
420 425 



<210> 5 
<211> 1221 
<212> DNA 

<213> Streptomyces griseolus 

<220> 

<221> CDS 

<222> (1) . . (1218) 

<223> coding for cytochrome P450-Sul (suaC) 
<400> 5 

atg acc gat acc gcc acg acg ccc cag acc acg gac gca ccc gcc ttc 48 
Met Thr Asp Thr Ala Thr Thr Pro Gin Thr Thr Asp Ala Pro Ala Phe 
15 10 15 

ccg age aac egg age tgt ccc tac cag tta ccg gac ggc tac gcc cag 96 
Pro Ser Asn Arg Ser Cys Pro Tyr Gin Leu Pro Asp Gly Tyr Ala Gin 
20 25 30 

etc egg gac acc ccc ggc ccc ctg cac egg gtg acg etc tac gac ggc 144 
Leu Arg Asp Thr Pro Gly Pro Leu His Arg Val Thr Leu Tyr Asp Gly 
35 40 45 

cgt cag gcg tgg gtg gtg acc aag cac gag gcc gcg cgc aaa ctg etc 192 
Arg Gin Ala Trp Val Val Thr Lys His Glu Ala Ala Arg Lys Leu Leu 
50 55 60 

ggc gac ccc egg ctg tec tec aac egg acg gac gac aac ttc ccc gcc 240 
Gly Asp Pro Arg Leu Ser Ser Asn Arg Thr Asp Asp Asn Phe Pro Ala 
65 70 75 80 

acg tea ccg cgc ttc gag gcc gtc egg gag age ccg cag gcg ttc ate 288 
Thr Ser Pro Arg Phe Glu Ala Val Arg Glu Ser Pro Gin Ala Phe He 

85 90 95 

ggc ctg gac ccg ccc gag cac ggc acc egg egg egg atg acg ate age 336 
Gly Leu Asp Pro Pro Glu His Gly Thr Arg Arg Arg Met Thr He Ser 
100 105 110 
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gag ttc acc gtc aag egg ate aag ggc atg cgc ccc gag gtc gag gag 3 84 
Glu Phe Thr Val Lys Arg He Lys Gly Met Arg Pro Glu Val Glu Glu 
115 120 125 

gtg gtg cac ggc ttc etc gac gag atg ctg gee gec ggc ccg acc gee 432 
Val Val His Gly Phe Leu Asp Glu Met Leu Ala Ala Gly Pro Thr Ala 
130 135 140 

gac ctg gtc agt cag ttc gcg ctg ccg gtg ccc tec atg gtg ate tgc 480 
Asp Leu Val Ser Gin Phe Ala Leu Pro Val Pro Ser Met Val He Cys 
145 . 150 155 160 

cga etc etc ggc gtg ccc tac gee gac cac gag ttc ttc cag gac gcg 528 
Arg Leu Leu Gly Val Pro Tyr Ala Asp His Glu Phe Phe Gin Asp Ala 
165 170 175 

age aag egg ctg gtg cag tec acg gac gcg cag age gcg etc acc gcg 57 6 
Ser Lys Arg Leu Val Gin Ser Thr Asp Ala Gin Ser Ala Leu Thr Ala 
180 185 190 

egg aac gac etc gcg ggt tac ctg gac ggc etc ate acc cag ttc cag 624 
Arg Asn Asp Leu Ala Gly Tyr Leu Asp Gly Leu He Thr Gin Phe Gin 
195 200 205 

acc gaa ccg ggc gcg ggc ctg gtg ggc get ctg gtc gee gac cag ctg 672 
Thr Glu Pro Gly Ala Gly Leu Val Gly Ala Leu Val Ala Asp Gin Leu 
210 215 220 

gee aac ggc gag ate gac cgt gag gaa ctg ate tec acc gcg atg ctg 720 
Ala Asn Gly Glu He Asp Arg Glu Glu Leu He Ser Thr Ala Met Leu 
225 230 235 240 

etc etc ate gee ggc cac gag acc acg gee teg atg acc. tec etc age 768 
Leu Leu He Ala Gly His Glu Thr Thr Ala Ser Met Thr Ser Leu Ser 
245 250 255 

gtg ate acc ctg ctg gac cac ccc gag cag tac gee gee ctg cgc gee 816 
Val He Thr Leu Leu Asp His Pro Glu Gin Tyr Ala Ala Leu Arg Ala 
260 265 270 

gac cgc age etc gtg ccc ggc gcg gtg gag gaa ctg etc cgc tac etc 864 
Asp Arg Ser Leu Val Pro Gly Ala Val Glu Glu Leu Leu Arg Tyr Leu 
275 280 285 

gec ate gee gac ate gcg ggc ggc cgc gtc gee acg gcg gac ate gag 912 
Ala He Ala Asp He Ala Gly Gly Arg Val Ala Thr Ala Asp He Glu 
290 295 300 

gtc gag ggg cac etc ate egg gec ggc gag ggc gtg ate gtc gtc aac 960 
Val Glu Gly His Leu He Arg Ala Gly Glu Gly Val He Val Val Asn 
305 310 315 320 

teg ata gec aac egg gac ggc acg gtg tac gag gac ccg gac gee etc 1008 
Ser He Ala Asn Arg Asp Gly Thr Val Tyr Glu Asp Pro Asp Ala Leu 
325 330 335 

gac ate cac cgc tec gcg cgc cac cac etc gee ttc ggc ttc ggc gtg 1056 
Asp He His Arg Ser Ala Arg His His Leu Ala Phe Gly Phe Gly Val 
340 345 350 

cac cag tgc ctg ggc cag aac etc gee egg ctg gag ctg gag gtc ate 1104 
His Gin Cys Leu Gly Gin Asn Leu Ala Arg Leu Glu Leu Glu Val He 
355 360 365 

etc aac gee etc atg gac cgc gtc ccg acg ctg cga ctg gee gtc ccc 1152 
Leu Asn Ala Leu Met Asp Arg Val Pro Thr Leu Arg Leu Ala Val Pro 
370 375 380 
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gtc gag cag ttg gtg ctg egg ccg ggt acg acg ate cag ggc gtc aac 1200 
Val Glu Gin Leu Val Leu Arg Pro Gly Thr Thr lie Gin Gly Val Asn 
385 390 395 400 

gaa etc ccg gtc acc tgg tga 1221 
Glu Leu Pro Val Thr Trp 
405 

<210> 6 
<211> 406 
<212> PRT 

<213> Streptomyces griseolus 
<400> 6 

Met Thr Asp Thr Ala Thr Thr Pro Gin Thr Thr Asp Ala Pro Ala Phe 
15 10 15 

Pro Ser Asn Arg Ser Cys Pro Tyr Gin Leu Pro Asp Gly Tyr Ala Gin 
20 25 30 

Leu Arg Asp Thr Pro Gly Pro Leu His Arg Val Thr Leu Tyr Asp Gly 
35 40 45 

Arg Gin Ala Trp Val Val Thr Lys His Glu Ala Ala Arg Lys Leu Leu 
50 55 60 

Gly Asp Pro Arg Leu Ser Ser Asn Arg Thr Asp Asp Asn Phe Pro Ala 
65 70 75 80 

Thr Ser Pro Arg Phe Glu Ala Val Arg Glu Ser Pro Gin Ala Phe lie 

85 90 95 

Gly Leu Asp Pro Pro Glu His Gly Thr Arg Arg Arg Met Thr lie Ser 
100 105 110 

Glu Phe Thr Val Lys Arg He Lys Gly Met Arg Pro Glu Val Glu Glu 
115 120 125 

Val Val His Gly Phe Leu Asp Glu Met Leu Ala Ala Gly Pro Thr Ala 
130 135 140 

Asp Leu Val Ser Gin Phe Ala Leu Pro Val Pro Ser Met Val He Cys 
145 150 155 160 

Arg Leu Leu Gly Val Pro Tyr Ala Asp His Glu Phe Phe Gin Asp Ala 
165 170 175 

Ser Lys Arg Leu Val Gin Ser Thr Asp Ala Gin Ser Ala Leu Thr Ala 
180 185 190 

Arg Asn Asp Leu Ala Gly Tyr Leu Asp Gly Leu He Thr Gin Phe Gin 
195 200 205 

Thr Glu Pro Gly Ala Gly Leu Val Gly Ala Leu Val Ala Asp Gin Leu 
210 215 220 

Ala Asn Gly Glu He Asp Arg Glu Glu Leu He Ser Thr Ala Met Leu 
225 230 235 240 

Leu Leu He Ala Gly His Glu Thr Thr Ala Ser Met Thr Ser Leu Ser 
245 250 255 

Val He Thr Leu Leu Asp His Pro Glu Gin Tyr Ala Ala Leu Arg Ala 
260 265 270 

Asp Arg Ser Leu Val Pro Gly Ala Val Glu Glu Leu Leu Arg Tyr Leu 
275 280 285 

Ala He Ala Asp He Ala Gly Gly Arg Val Ala Thr Ala Asp He Glu 
290 295 300 
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Val Glu Gly His Leu He Arg Ala Gly Glu Gly Val He Val Val Asn 
305 310 315 320 

Ser He Ala Asn Arg Asp Gly Thr Val Tyr Glu Asp Pro Asp Ala Leu 
325 330 335 

Asp He His Arg Ser Ala Arg His His Leu Ala Phe Gly Phe Gly Val 
340 345 350* 

His Gin Cys Leu Gly Gin Asn Leu Ala Arg Leu Glu Leu Glu Val He 
355 360 365 

Leu Asn Ala Leu Met Asp Arg Val Pro Thr Leu Arg Leu Ala Val Pro 
370 375 380 

Val Glu Gin Leu Val Leu Arg Pro Gly Thr Thr He Gin Gly Val Asn 
385 390 395 400 

Glu Leu Pro Val Thr Trp 
405 



96 



<210> 7 
<211> 1404 
<212> DNA 

<213> Agrobacterium tumef aciens 

<220> 

<221> CDS 

<222> (1) . . (1401) 

<223> coding for indole acetamide hydrolase (tms2) 
<400> 7 

atg gtg ccc att acc teg tta gca caa acc eta gaa cgc ctg aga egg 48 
Met Val Pro He Thr Ser Leu Ala Gin Thr Leu Glu Arg Leu Arg Arg 
15 10 15 

aaa gac tac tec tgc tta gaa eta gta gaa act ctg ata gcg cgt tgc 
Lys Asp Tyr Ser Cys Leu Glu Leu Val Glu Thr Leu He Ala Arg Cys 
20 25 30 

caa get gca aaa cca tta aat gec ctt ctg get aca gac tgg gat ggc 144 
Gin Ala Ala Lys Pro Leu Asn Ala Leu Leu Ala Thr Asp Trp Asp Gly 
35 40 45 

ttg egg cga age gec aaa aaa att gat cgt cat gga aac gee gga tta 192 
Leu Arg Arg Ser Ala Lys Lys He Asp Arg His Gly Asn Ala Gly Leu 
50 55 60 

ggt ctt tgc ggc att cca etc tgt ttt aag gcg aac ate gcg acc ggc 240 
Gly Leu Cys Gly He Pro Leu Cys Phe Lys Ala Asn He Ala Thr Gly 
65 70 75 80 

ata ttt cct aca age get get act ccg gcg ctg ata aac cac ttg cca 288 
He Phe Pro Thr Ser Ala Ala Thr Pro Ala Leu He Asn His Leu Pro 

85 90 95 

aag ata cca tec cgc gtc gca gaa aga ctt ttt tea get gga gca ctg 336 
Lys He Pro Ser Arg Val Ala Glu Arg Leu Phe Ser Ala Gly Ala Leu 
100 105 HO 

ccg ggt gee teg gga aac atg cat gag tta teg ttt gga att acg age 384 
Pro Gly Ala Ser Gly Asn Met His Glu Leu Ser Phe Gly He Thr Ser 
115 120 125 

aac aac tat gee acc ggt gcg gtg egg aac ccg tgg aat cca agt ctg 432 
Asn Asn Tyr Ala Thr Gly Ala Val Arg Asn Pro Trp Asn Pro Ser Leu 
130 135 140 
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ata cca gga ggc 
lie Pro Gly Gly 
145 

ttg atg tta ggc 
Leu Met Leu Gly 

ccc gca gcc ctg 
Pro Ala Ala Leu 
180 

tat cca aga gat 
Tyr Pro Arg Asp 
195 

gga ate ata gcg 
Gly lie lie Ala 
210 

att tec gga egg 
lie Ser Gly Arg 
225 

egg ate ggc etc 
Arg lie Gly Leu 

gtg gcc ttc gca 
Val Ala Phe Ala 
260 

gta ace ttt gtt 
Val Thr Phe Val 
275 

ggg gca agt ttg 
Gly Ala Ser Leu 
290 

aag tat etc gac 
Lys Tyr Leu Asp 
305 

aaa gga att cgt 
Lys Gly lie Arg 

gat ggg cat caa 
Asp Gly His Gin 
340 

ttc agg cca agg 
Phe Arg Pro Arg 
355 

cag tta gat gca 
Gin Leu Asp Ala 
370 

ata ggt cag gag 
lie Gly Gin Glu 
385 

ttc aag ate tac 
Phe Lys lie Tyr 




tea age ggt 
Ser Ser Gly 
150 

ggc ata ggc 
Gly He Gly 
165 

tgt ggc gta 
Cys Gly Val 

egg ata ata 
Arg He He 

cag tgc gta 
Gin Cys Val 
215 

teg gcg aaa 
Ser Ala Lys 
230 

ccc act acc 
Pro Thr Thr 
245 

get gaa acg 
Ala Glu Thr 



gaa gcc gac 
Glu Ala Asp 

cca att gcg 
Pro He Ala 
295 

gat ttt gtg 
Asp Phe Val 
310 

age ccc gat 
Ser Pro Asp 
325 

att tec aac 
He Ser Asn 

etc cag gcc 
Leu Gin Ala 

ate ctt ttc 
He Leu Phe 
375 

teg tea gtc 
Ser Ser Val 
390 

gtg cga aat 
Val Arg Asn 
405 



11 

ggt gtg get get 
Gly Val Ala Ala 
155 

acc gat acc ggt 
Thr Asp Thr Gly 
170 

gta gga ttt cga 
Val Gly Phe Arg 
185 

ccg gtc age ccc 
Pro Val Ser Pro 
200 

gcc gat gtt ata 
Ala Asp Val He 

att tea ccc atg 
He Ser Pro Met 
235 

tac ttt tac gat 
Tyr Phe Tyr Asp 
250 

acg att cgc ttg 
Thr He Arg Leu 
265 

ate ccc cac eta 
He Pro His Leu 
280 

ctt tac gaa ttt 
Leu Tyr Glu Phe 

gga aca gtt tct 
Gly Thr Val Ser 
315 

gta gcg aac att 
Val Ala Asn He 
330 

gat gaa tat gaa 
Asp Glu Tyr Glu 
345 

act tat egg aat 
Thr Tyr Arg Asn 
360 

cca act gca ccc 
Pro Thr Ala Pro 

ate cac aat ggc 
He His Asn Gly 
395 

gtg gac cca age 
Val Asp Pro Ser 
410 




gcg gtg gca 
Ala Val Ala 

gca tct gtt 
Ala Ser Val 

ccg acg ctt 
Pro Thr Leu 
190 

acc egg gac 
Thr Arg Asp 
205 

ate etc gac 
He Leu Asp 
220 

ccg ctg aag 
Pro Leu Lys 

gac ctt gat 
Asp Leu Asp 

eta gcc aac 
Leu Ala Asn 
270 

gag gaa ctg 
Glu Glu Leu 
285 

cca cac get 
Pro His Ala 
300 

ttt tct gac 
Phe Ser Asp 

gtc agt gcg 
Val Ser Ala 

ctg gcg cgt 
Leu Ala Arg 
350 

tac ttc aga 
Tyr Phe Arg 
365 

tta gcg gcc 
Leu Ala Ala 
380 

tea atg atg 
Ser Met Met 

age aac gca 
Ser Asn Ala 



age cga 480 
Ser Arg 
160 

cgc eta 528 

Arg Leu 

175 

get cga 576 
Ala Arg 

acc gcc 624 
Thr Ala 

cag gtg 672 
Gin Val 

ggg ctt 720 
Gly Leu 
240 

get gat 768 

Ala Asp 

255 

aga ggc 816 
Arg Gly 

aat agt 864 
Asn Ser 

eta aaa 912 
Leu Lys 

gtt ate 960 
Val He 
320 

caa att 1008 

Gin He 

335 

caa tec 1056 
Gin Ser 

etc tat 1104 
Leu Tyr 

aaa gcc 1152 
Lys Ala 

aac act 1200 
Asn Thr 
400 

ggc eta 1248 

Gly Leu 

415 
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cct 
w» Pro 


ggg 

Gly 


ttg 
Leu 


age 
Ser 
420 


ctt 
Leu 


cct 
Pro 


gec 
Ala 


tgc 
Cys 


ctt 
Leu 
425 


aca 
Thr 


cct 
Pro 


gat 
Asp 


cgc 
Arg 


ttg 
Leu 
430 


cct 
Pro 


gtt 
Val 


1296 


gga 

Gly 


atg 
Met 


gaa 
Glu 
435 


att 
He 


gat gga 
Asp Gly 


tta 
Leu 


gcg 
Ala 
440 


ggg 

Gly 


tea 
Ser 


gac 
Asp 


cac 
His 


cgt 
Arg 
445 


ctg 
Leu 


tta 
Leu 


gca 
Ala 


1344 


ate 
He 


ggg 

Gly 
450 


gca 
Ala 


gca 
Ala 


tta 
Leu 


gaa 
Glu 


aaa 
Lvs 
455 


gec 
Ala 


ata 
Tie 

•i- JL. C 


aat 

noli 


ttt 

-fllti 


cct 
Pro 
460 


tec 

Cor 


ttt 

"Din ^-w 

irne 


ccc 
Pro 


gat 
Asp 


1392 


get 
Ala 


ttt 
Phe 


aat 
Asn 


tag 
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465 

<210> 8 
<211> 467 
<212> PRT 

<213> Agrobacterium tumefaciens 
<400> 8 

Met Val Pro He Thr Ser Leu Ala Gin Thr Leu Glu Arg Leu Arg Arg 
1 5 10 15 

Lys Asp Tyr Ser Cys Leu Glu Leu Val Glu Thr Leu He Ala Arg Cys 
20 25 30 

Gin Ala Ala Lys Pro Leu Asn Ala Leu Leu Ala Thr Asp Trp Asp Gly 
35 40 45 

Leu Arg Arg Ser Ala Lys Lys He Asp Arg His Gly Asn Ala Gly Leu 
50 55 60 

Gly Leu Cys Gly He Pro Leu Cys Phe Lys Ala Asn He Ala Thr Gly 
65 70 75 80 

He Phe Pro Thr Ser Ala Ala Thr Pro Ala Leu He Asn His Leu Pro 

85 90 95 

Lys He Pro Ser Arg Val Ala Glu Arg Leu Phe Ser Ala Gly Ala Leu 
100 105 110 

Pro Gly Ala Ser Gly Asn Met His Glu Leu Ser Phe Gly He Thr Ser 
115 120 125 

Asn Asn Tyr Ala Thr Gly Ala Val Arg Asn Pro Trp Asn Pro Ser Leu 
130 135 140 

He Pro Gly Gly Ser Ser Gly Gly Val Ala Ala Ala Val Ala Ser Arg 
145 150 155 160 

Leu Met Leu Gly Gly He Gly Thr Asp Thr Gly Ala Ser Val Arg Leu 

165 170 175 

Pro Ala Ala Leu Cys Gly Val Val Gly Phe Arg Pro Thr Leu Ala Arg 

180 185 190 

Tyr Pro Arg Asp Arg He He Pro Val Ser Pro Thr Arg Asp Thr Ala 

195 200 205 

Gly He He Ala Gin Cys Val Ala Asp Val He He Leu Asp Gin Val 
210 215 220 

He Ser Gly Arg Ser Ala Lys He Ser Pro Met Pro Leu Lys Gly Leu 
225 230 235 ^ 240 

Arg He Gly Leu Pro Thr Thr Tyr Phe Tyr Asp Asp Leu Asp Ala Asp 
245 250 255 
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Val Ala Phe Ala Ala Glu Thr Thr lie Arg Leu Leu Ala Asn Arg Gly 
260 265 270 

Val Thr Phe Val Glu Ala Asp lie Pro His Leu Glu Glu Leu Asn Ser 
275 280 285 

Gly Ala Ser Leu Pro He Ala Leu Tyr Glu Phe Pro His Ala Leu Lys 
290 295 300 

Lys Tyr Leu Asp Asp Phe Val Gly Thr Val Ser Phe Ser Asp Val He 
305 310 315 320 

Lys Gly He Arg Ser Pro Asp Val Ala Asn He Val Ser Ala Gin He 
325 330 335 

Asp Gly His Gin He Ser Asn Asp Glu Tyr Glu Leu Ala Arg Gin Ser 
340 345 350 

Phe Arg Pro Arg Leu Gin Ala Thr Tyr Arg Asn Tyr Phe Arg Leu Tyr 
355 360 365 

Gin Leu Asp Ala He Leu Phe Pro Thr Ala Pro Leu Ala Ala Lys Ala 
370 375 380 

He Gly Gin Glu Ser Ser Val He His Asn Gly Ser Met Met Asn Thr 
385 390 395 400 

Phe Lys He Tyr Val Arg Asn Val Asp Pro Ser Ser Asn Ala Gly Leu 
405 410 415 

Pro Gly Leu Ser Leu Pro Ala Cys Leu Thr Pro Asp Arg Leu Pro Val 
420 425 430 

Gly Met Glu He Asp Gly Leu Ala Gly Ser Asp His Arg Leu Leu Ala 
435 440 445 

He Gly Ala Ala Leu Glu Lys Ala He Asn Phe Pro Ser Phe Pro Asp 
450 455 460 

Ala Phe Asn 
465 



<210> 9 
<211> 1404 
<212> DNA 

<213> Agrobacterium tumefaciens 

<220> 

<221> CDS 

<222> (1) . . (1401) 

<223> coding for indole acetamide hydrolase (tms2) 
<400> 9 

atg gtg ccc att acc teg tta gca caa acc eta gaa cgc ctg aga egg 48 
Met Val Pro He Thr Ser Leu Ala Gin Thr Leu Glu Arg Leu Arg Arg 
15 10 15 

aaa gac tac tec tgc tta gaa eta gta gaa act ctg ata gcg cgt tgc 96 
Lys Asp Tyr Ser Cys Leu Glu Leu Val Glu Thr Leu He Ala Arg Cys 
20 25 30 

caa get gca aaa cca tta aat gee ctt ctg get aca gac tgg gat ggc 144 
Gin Ala Ala Lys Pro Leu Asn Ala Leu Leu Ala Thr Asp Trp Asp Gly 
35 40 45 

ttg egg cga age gee aaa aaa att gat cgt cat gga aac gee gga tta 192 
Leu Arg Arg Ser Ala Lys Lys He Asp Arg His Gly Asn Ala Gly Leu 
50 55 60 
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ggt ctt tgc ggc att cca etc tgt ttt aag gcg aac ate gcg acc ggc 240 

Gly Leu Cys Gly lie Pro Leu Cys Phe Lys Ala Asn lie Ala Thr Gly 
65 70 75 80 

ata ttt cct aca age get get act ccg gcg ctg ata aac cac ttg cca 288 
lie Phe Pro Thr Ser Ala Ala Thr Pro Ala Leu lie Asn His Leu Pro 

85 90 95 

aag ata cca tec cgc gtc gca gaa aga ctt ttt tea get gga gca ctg 336 
Lys He Pro Ser Arg Val Ala Glu Arg Leu Phe Ser Ala Gly Ala Leu 
100 105 110 

ccg ggt gec teg gga aac atg cat gag tta teg ttt gga att acg age 3 84 
Pro Gly Ala Ser Gly Asn Met His Glu Leu Ser Phe Gly He Thr Ser 
115 120 125 

aac aac tat gee acc ggt gcg gtg egg aac ccg tgg aat cca agt ctg 432 
Asn Asn Tyr Ala Thr Gly Ala Val Arg Asn Pro Trp Asn Pro Ser Leu 
130 135 140 

ata cca gga ggc tea age ggt ggt gtg get get gcg gtg gca age cga 480 
He Pro Gly Gly Ser Ser Gly Gly Val Ala Ala Ala Val Ala Ser Arg 
145 150 155 160 

ttg atg tta ggc ggc ata ggc acc gat acc ggt gca tct gtt cgc eta 528 
Leu Met Leu Gly Gly He Gly Thr Asp Thr Gly Ala Ser Val Arg Leu 
165 170 175 

ccc gca gee ctg tgt ggc gta gta gga ttt cga ccg acg ctt get cga 576 
Pro Ala Ala Leu Cys Gly Val Val Gly Phe Arg Pro Thr Leu Ala Arg 
180 185 190 

tat cca aga gat egg ata ata ccg gtc age ccc acc egg gac acc gee 624 
Tyr Pro Arg Asp Arg He He Pro Val Ser Pro Thr Arg Asp Thr Ala 
195 200 205 

gga ate ata gcg cag tgc gta gee gat gtt ata ate etc gat cag gtg 672 
Gly He He Ala Gin Cys Val Ala Asp Val He He Leu Asp Gin Val 
210 215 220 

att tec gga egg teg gcg aaa att tea ccc atg ccg ctg aag ggg ctt 720 
He Ser Gly Arg Ser Ala Lys He Ser Pro Met Pro Leu Lys Gly Leu 
225 230 235 240 

egg ate ggc etc ccc act acc tac ttt tac gat gac ctt gat get gat 7 68 
Arg He Gly Leu Pro Thr Thr Tyr Phe Tyr Asp Asp Leu Asp Ala Asp 
245 250 255 

gtg gee ttc gca get gaa acg acg att cgc ttg eta gee aac aga ggc 816 
Val Ala Phe Ala Ala Glu Thr Thr He Arg Leu Leu Ala Asn Arg Gly 
260 265 270 

gta acc ttt gtt gaa gee gac ate ccc cac eta gag gaa ctg aat agt 864 
Val Thr Phe Val Glu Ala Asp He Pro His Leu Glu Glu Leu Asn Ser 
275 280 285 

ggg gca agt ttg cca att gcg ctt tac gaa ttt cca cac get eta aaa 912 
Gly Ala Ser Leu Pro He Ala Leu Tyr Glu Phe Pro His Ala Leu Lys 
290 295 300 

aag tat etc gac gat ttt gtg gga aca gtt tct ttt tct gac gtt ate 960 
Lys Tyr Leu Asp Asp Phe Val Gly Thr Val Ser Phe Ser Asp Val He 
305 310 315 320 

aaa gga att cgt age ccc gat gta gcg aac att gtc agt gcg caa att 1008 
Lys Gly He Arg Ser Pro Asp Val Ala Asn He Val Ser Ala Gin He 
325 330 335 
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gat ggg cat caa att tec aac gat gaa tat gaa ctg gcg cgt caa tec 1056 
Asp Gly His Gin lie Ser Asn Asp Glu Tyr Glu Leu Ala Arg Gin Ser 
340 345 350 

ttc agg cca agg etc cag gec act tat egg aat tac ttc aga etc tat 1104 
Phe Arg Pro Arg Leu Gin Ala Thr Tyr Arg Asn Tyr Phe Arg Leu Tyr 
355 3 60 3 65 

cag tta gat gca ate ctt ttc cca act gca ccc tta gcg gec aaa gec 1152 
Gin Leu Asp Ala lie Leu Phe Pro Thr Ala Pro Leu Ala Ala Lys Ala 
370 375 380 

ata ggt cag gag teg tea gtc ate cac aat ggc tea atg ata aac act 1200 
lie Gly Gin Glu Ser Ser Val lie His Asn Gly Ser Met lie Asn Thr 
385 390 395 400 

ttc aag ate tac gtg cga aat gtg gac cca age age aac gca ggc eta 1248 
Phe Lys lie Tyr Val Arg Asn Val Asp Pro Ser Ser Asn Ala Gly Leu 
405 410 415 

cct ggg ttg age ctt cct gee tgc ctt aca cct gat cgc ttg cct gtt 1296 
Pro Gly Leu Ser Leu Pro Ala Cys Leu Thr Pro Asp Arg Leu Pro Val 
420 425 430 

gga atg gaa att gac gga tta gcg ggg tea gac cac cgt ctg tta gca 1344 
Gly Met Glu lie Asp Gly Leu Ala Gly Ser Asp His Arg Leu Leu Ala 
435 440 445 

ate ggg gca gca tta gaa aaa gee ata aat ttt cct tec ttt ccc gat 1392 
lie Gly Ala Ala Leu Glu Lys Ala lie Asn Phe Pro Ser Phe Pro Asp 
450 455 460 

get ttt aat tag 1404 

Ala Phe Asn 

465 

<210> 10 
<211> 467 
<212> PRT 

<213> Agrobacterium tumefaciens 
<400> 10 

Met Val Pro He Thr Ser Leu Ala Gin Thr Leu Glu Arg Leu Arg Arg 
15 10 ~ 15 

Lys Asp Tyr Ser Cys Leu Glu Leu Val Glu Thr Leu He Ala Arg Cys 
20 25 30 

Gin Ala Ala Lys Pro Leu Asn Ala Leu Leu Ala Thr Asp Trp Asp Gly 
35 40 45 

Leu Arg Arg Ser Ala Lys Lys He Asp Arg His Gly Asn Ala Gly Leu 
50 55 60 

Gly Leu Cys Gly He Pro Leu Cys Phe Lys Ala Asn He Ala Thr Gly 
65 70 75 80 

He Phe Pro Thr Ser Ala Ala Thr Pro Ala Leu He Asn His Leu Pro 

85 90 95 

Lys He Pro Ser Arg Val Ala Glu Arg Leu Phe Ser Ala Gly Ala Leu 
100 105 HO 

Pro Gly Ala Ser Gly Asn Met His Glu Leu Ser Phe Gly He Thr Ser 
115 120 125 

Asn Asn Tyr Ala Thr Gly Ala Val Arg Asn Pro Trp Asn Pro Ser Leu 
130 135 140 
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He Pro Gly Gly Ser Ser Gly Gly Val Ala Ala Ala Val Ala Ser Arg 
145 150 155 160 

Leu Met Leu Gly Gly He Gly Thr Asp Thr Gly Ala Ser Val Arg Leu 
165 170 175 

Pro Ala Ala Leu Cys Gly Val Val Gly Phe Arg Pro Thr Leu Ala Arg 
180 185 190 

Tyr Pro Arg Asp Arg He He Pro Val Ser Pro Thr Arg Asp Thr Ala 
195 200 205 

Gly lie He Ala Gin Cys Val Ala Asp Val He He Leu Asp Gin Val 
210 215 220 

He Ser Gly Arg Ser Ala Lys He Ser Pro Met Pro Leu Lys Gly Leu 
225 230 235 ^ 240 

Arg He Gly Leu Pro Thr Thr Tyr Phe Tyr Asp Asp Leu Asp Ala Asp 
245 250 255 

Val Ala Phe Ala Ala Glu Thr Thr He Arg Leu Leu Ala Asn Arg Gly 
2 60 2 65 270 

Val Thr Phe Val Glu Ala Asp He Pro His Leu Glu Glu Leu Asn Ser 
275 280 285 

Gly Ala Ser Leu Pro He Ala Leu Tyr Glu Phe Pro His Ala Leu Lys 
290 295 300 

Lys Tyr Leu Asp Asp Phe Val Gly Thr Val Ser Phe Ser Asp Val He 
305 310 315 320 

Lys Gly He Arg Ser Pro Asp Val Ala Asn He Val Ser Ala Gin He 
325 330 335 

Asp Gly His Gin He Ser Asn Asp Glu Tyr Glu Leu Ala Arg Gin Ser 
340 345 350 

Phe Arg Pro Arg Leu Gin Ala Thr Tyr Arg Asn Tyr Phe Arg Leu Tyr 
355 360 365 

Gin Leu Asp Ala He Leu Phe Pro Thr Ala Pro Leu Ala Ala Lys Ala 
370 375 380 

He Gly Gin Glu Ser Ser Val He His Asn Gly Ser Met He Asn Thr 
385 390 395 400 

Phe Lys He Tyr Val Arg Asn Val Asp Pro Ser Ser Asn Ala Gly Leu 
405 410 415 

Pro Gly Leu Ser Leu Pro Ala Cys Leu Thr Pro Asp Arg Leu Pro Val 
420 425 430 

Gly Met Glu He Asp Gly Leu Ala Gly Ser Asp His Arg Leu Leu Ala 
435 440 445 

He Gly Ala Ala Leu Glu Lys Ala He Asn Phe Pro Ser Phe Pro Asp 
450 455 460 

Ala Phe Asn 
465 



<210> 11 
<211> 609 
<212> DNA 

<213> Xanthobacter autotrophicus 
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<220> 

<221> CDS 

<222> (1) . . (603) 

<223> coding for haloalkane dehalohenase 
<400> 11 

atg tea acg ttt ttt gaa ccg gag aac gga atg aaa caa aac gec aaa 48 
Met Ser Thr Phe Phe Glu Pro Glu Asn Gly Met Lys Gin Asn Ala Lys 
1 5 10 15 

acc gaa cga ate ctg gat gtc gcg etc gaa ttg ctt gag aca gag ggt 96 
Thr Glu Arg lie Leu Asp Val Ala Leu Glu Leu Leu Glu Thr Glu Gly 
20 25 30 

gag ttt ggt ttg acg atg agg cag gtg gca acg caa gcg gac atg tec 144 
Glu Phe Gly Leu Thr Met Arg Gin Val Ala Thr Gin Ala Asp Met Ser 
35 40 45 

ctg age aac gtt cag tac tat ttc aag tec gag gac ctg etc etc gtg 192 
Leu Ser Asn Val Gin Tyr Tyr Phe Lys Ser Glu Asp Leu Leu Leu Val 
50 55 60 

gee atg gca gac cgt tac ttt caa egg tgc ctg aca acc atg get gag 240 
Ala Met Ala Asp Arg Tyr Phe Gin Arg Cys Leu Thr Thr Met Ala Glu 
65 70 75 80 

cat ccg ccc tta teg gca ggg cgt gat caa cac gee cag tta aga gcg 2 88 
His Pro Pro Leu Ser Ala Gly Arg Asp Qln His Ala Gin Leu Arg Ala 

85 90 95 ' 

ttg tta cga gaa ctg etc ggt cat ggt ctt gag att tec gag atg tgt 33 6 
Leu Leu Arg Glu Leu Leu Gly His Gly Leu Glu lie Ser Glu Met Cys 
100 105 110 

cga ata ttc agg gag tac tgg gca ate gee acc cgt aat gaa act gtt 384 
Arg lie Phe Arg Glu Tyr Trp Ala lie Ala Thr Arg Asn Glu Thr Val 
115 120 125 

cac ggc tat etc aag teg tac tat egg gat etc gee gaa gtg atg get 432 
His Gly Tyr Leu Lys Ser Tyr Tyr Arg Asp Leu Ala Glu Val Met Ala 
130 135 140 

gag aag ctt gcg cca ctg gee age age gaa aag gcg ctg gee gtg gee 480 
Glu Lys Leu Ala Pro Leu Ala Ser Ser Glu Lys Ala Leu Ala Val Ala 
145 150 155 160 

gta tct ttg gtt att cct tat gtt gag ggg tat teg gta acg gee att 52 8 
Val Ser Leu Val He Pro Tyr Val Glu Gly Tyr Ser Val Thr Ala He 
165 170 175 

gca atg ccc gaa tec att gat acg att tec gag acg ctg acc aat gtg 576 
Ala Met Pro Glu Ser He Asp Thr He Ser Glu Thr Leu Thr Asn Val 
180 185 190 

gtg ttg gag cag ctt cgc ate age aat tcatga 609 
Val Leu Glu Gin Leu Arg He Ser Asn 
195 200 

<210> 12 
<211> 201 
<212> PRT 

<213> Xanthobacter autotrophicus 
<400> 12 

Met Ser Thr Phe Phe Glu Pro Glu Asn Gly Met Lys Gin Asn Ala Lys 
1 5 10 15 
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Thr Glu Arg He Leu Asp Val Ala Leu Glu Leu Leu Glu Thr Glu Gly 
' 20 25 30 

Glu Phe Gly Leu Thr Met Arg Gin Val Ala Thr Gin Ala Asp Met Ser 
35 40 45 

Leu Ser Asn Val Gin Tyr Tyr Phe Lys Ser Glu Asp Leu Leu Leu Val 
50 55 60 

Ala Met Ala Asp Arg Tyr Phe Gin Arg Cys Leu Thr Thr Met Ala Glu 
65 70 75 80 

His Pro Pro Leu Ser Ala Gly Arg Asp Gin His Ala Gin Leu Arg Ala 

85 90 95 

Leu Leu Arg Glu Leu Leu Gly His Gly Leu Glu He Ser Glu Met Cys 
100 105 110 

Arg He Phe Arg Glu Tyr Trp Ala He Ala Thr Arg Asn Glu Thr Val 
115 120 125 

His Gly Tyr Leu Lys Ser Tyr Tyr Arg Asp Leu Ala Glu Val Met Ala 
130 135 140 

| Glu Lys Leu Ala Pro Leu Ala Ser Ser Glu Lys Ala Leu Ala Val Ala 
r i45 * 150 155 160 

Val Ser Leu Val He Pro Tyr Val Glu Gly Tyr Ser Val Thr Ala He 
165 170 175 

Ala Met Pro Glu Ser He Asp Thr He Ser Glu Thr Leu Thr Asn Val 
180 185 190 

Val Leu Glu Gin Leu Arg He Ser Asn 
195 200 




<210> 13 
<211> 1131 
<212> DNA 

<213> Herpes simplex virus 1 

<220> 

<221> CDS 

<222> (1) . . (1128) 

<223> coding for thymidine kinase (TK) 
<400> 13 

atg get teg tac ccc tgc cat caa cac gcg tct gcg ttc gac cag get 48 
Met Ala Ser Tyr Pro Cys His Gin His Ala Ser Ala Phe Asp Gin Ala 
15 10 15 

gcg cgt tct cgc ggc cat age aac cga cgt acg gcg ttg cgc cct cgc 96 
Ala Arg Ser Arg Gly His Ser Asn Arg Arg Thr Ala Leu Arg Pro Arg 
20 25 30 

egg cag caa gaa gee acg gaa gtc cgc ctg gag cag aaa atg ccc acg 144 
Arg Gin Gin Glu Ala Thr Glu Val Arg Leu Glu Gin Lys Met Pro Thr 
35 40 45 

eta ctg egg gtt tat ata gac ggt cct cac ggg atg ggg aaa acc acc 192 
Leu Leu Arg Val Tyr He Asp Gly Pro His Gly Met Gly Lys Thr Thr 
50 55 60 

acc acg caa ctg ctg gtg gee ctg ggt teg cgc gac gat ate gtc tac 240 
Thr Thr Gin Leu Leu Val Ala Leu Gly Ser Arg Asp Asp He Val Tyr 
65 70 75 80 
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gta ccc gag ccg atg act tac tgg cag gtg ctg ggg get tec gag aca 288 
Val Pro Glu Pro Met Thr Tyr Trp Gin Val Leu Gly Ala Ser Glu Thr 

85 90 95 

ate gcg aac ate tac acc aca caa cac cgc etc gac cag ggt gag ata 336 
He Ala Asn He Tyr Thr Thr Gin His Arg Leu Asp Gin Gly Glu He 
100 105 110 

teg gee ggg gac gcg gcg gtg gta atg aca age gec cag ata aca atg 384 
Ser Ala Gly Asp Ala Ala Val Val Met Thr Ser Ala Gin He Thr Met 
115 120 125 

ggc atg cct tat gee gtg acc gac gec gtt ctg get cct cat gtc ggg 432 
Gly Met Pro Tyr Ala Val Thr Asp Ala Val Leu Ala Pro His Val Gly 
130 135 140 

ggg gag get ggg agt tea cat gec ccg ccc ccg gee etc acc etc ate 480 
Gly Glu Ala Gly Ser Ser His Ala Pro Pro Pro Ala Leu Thr Leu He 
145 150 155 160 

ttc gac cgc cat ccc ate gec gec etc ctg tgc tac ccg gee gcg cga 528 
Phe Asp Arg His Pro He Ala Ala Leu Leu Cys Tyr Pro Ala Ala Arg 
165 170 175 

tac ctt atg ggc age atg acc ccc cag gee gtg ctg gcg ttc gtg gee 576 
Tyr Leu Met Gly Ser Met Thr Pro Gin Ala Val Leu Ala Phe Val Ala 
180 185 190 

etc ate ccg ccg acc ttg ccc ggc aca aac ate gtg ttg ggg gec ctt 624 
Leu He Pro Pro Thr Leu Pro Gly Thr Asn He Val Leu Gly Ala Leu 
195 200 205 

ccg gag gac aga cac ate gac cgc ctg gee aaa cgc cag cgc ccc ggc 672 
Pro Glu Asp Arg His He Asp Arg Leu Ala Lys Arg Gin Arg Pro Gly 
210 215 220 

gag egg ctt gac ctg get atg ctg gee gcg att cgc cgc gtt tac ggg 720 
Glu Arg Leu Asp Leu Ala Met Leu Ala Ala He Arg Arg Val Tyr Gly 
225 230 235 ~ 240 

ctg ctt gee aat acg gtg egg tat ctg cag ggc ggc ggg teg tgg tgg 768 
Leu Leu Ala Asn Thr Val Arg Tyr Leu Gin Gly Gly Gly Ser Trp Trp 
245 250 ~ 255 

gag gat tgg gga cag ctt teg ggg acg gec gtg ccg ccc cag ggt gee 816 
Glu Asp Trp Gly Gin Leu Ser Gly Thr Ala Val Pro Pro Gin Gly Ala 
260 265 270 

gag ccc cag age aac gcg ggc cca cga ccc cat ate ggg gac acg tta 864 
Glu Pro Gin Ser Asn Ala Gly Pro Arg Pro His He Gly Asp Thr Leu 
275 280 285 

ttt acc ctg ttt egg gec ccc gag ttg ctg gee ccc aac ggc gac ctg 912 
Phe Thr Leu Phe Arg Ala Pro Glu Leu Leu Ala Pro Asn Gly Asp Leu 
290 295 300 

tat aac gtg ttt gec tgg gee ttg gac gtc ttg gec aaa cgc etc cgt 960 
Tyr Asn Val Phe Ala Trp Ala Leu Asp Val Leu Ala Lys Arg Leu Arg 
305 310 315 ~ 320 

ccc atg cac gtc ttt ate ctg gat tac gac caa teg ccc gee ggc tgc 1008 
Pro Met His Val Phe He Leu Asp Tyr Asp Gin Ser Pro Ala Gly Cys 
325 330 335 

egg gac gee ctg ctg caa ctt acc tec ggg atg gtc cag acc cac gtc 1056 
Arg Asp Ala Leu Leu Gin Leu Thr Ser Gly Met Val Gin Thr His Val 
340 345 350 
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, acc acc cca ggc tec ata ccg acg ate tgc gac ctg gcg cgc acg ttt 1104 
* Thr Thr Pro G iy ser lie Pro Thr lie Cys Asp Leu Ala Arg Thr Phe 
355 ~ 360 365 

gec egg gag atg ggg gag get aac tga 1131 
Ala Arg Glu Met Gly Glu Ala Asn 
370 375 

<210> 14 
<211> 376 
<212> PRT 

<213> Herpes simplex virus 1 
<400> 14 

Met Ala Ser Tyr Pro Cys His Gin His Ala Ser Ala Phe Asp Gin Ala 
15 10 15 

Ala Arg Ser Arg Gly His Ser Asn Arg Arg Thr Ala Leu Arg Pro Arg 

20 25 30 

Arg Gin Gin Glu Ala Thr Glu Val Arg Leu Glu Gin Lys Met Pro Thr 
35 40 45 

I Leu Leu Arg Val Tyr lie Asp Gly Pro His Gly Met Gly Lys Thr Thr 
1 50 55 60 

Thr Thr Gin Leu Leu Val Ala Leu Gly Ser Arg Asp Asp lie Val Tyr 
65 70 75 80 

Val Pro Glu Pro Met Thr Tyr Trp Gin Val Leu Gly Ala Ser Glu Thr 

85 90 95 

lie Ala Asn lie Tyr Thr Thr Gin His Arg Leu Asp Gin Gly Glu lie 

100 105 110 

Ser Ala Gly Asp Ala Ala Val Val Met Thr Ser Ala Gin He Thr Met 

115 120 125 

Gly Met Pro Tyr Ala Val Thr Asp Ala Val Leu Ala Pro His Val Gly 

130 135 140 

Gly Glu Ala Gly Ser Ser His Ala Pro Pro Pro Ala Leu Thr Leu He 
145 150 155 160 

Phe Asp Arg His Pro He Ala Ala Leu Leu Cys Tyr Pro Ala Ala Arg 
165 170 175 

Tyr Leu Met Gly Ser Met Thr Pro Gin Ala Val Leu Ala Phe Val Ala 
180 185 190 

Leu He Pro Pro Thr Leu Pro Gly Thr Asn He Val Leu Gly Ala Leu 

195 200 205 

Pro Glu Asp Arg His He Asp Arg Leu Ala Lys Arg Gin Arg Pro Gly 

210 215 220 

Glu Arg Leu Asp Leu Ala Met Leu Ala Ala He Arg Arg Val Tyr Gly 
225 ~ 230 235 240 

Leu Leu Ala Asn Thr Val Arg Tyr Leu Gin Gly Gly Gly Ser Trp Trp 
245 250 255 

Glu Asp Trp Gly Gin Leu Ser Gly Thr Ala Val Pro Pro Gin Gly Ala 
260 265 270 

Glu Pro Gin Ser Asn Ala Gly Pro Arg Pro His He Gly Asp Thr Leu 

275 280 285 

Phe Thr Leu Phe Arg Ala Pro Glu Leu Leu Ala Pro Asn Gly Asp Leu 

290 295 300 
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Tyr Asn Val Phe Ala Trp Ala Leu Asp Val L»eu Ala Lys Arg Leu Arg 
305 310 315 ** 320 

Pro Met His Val Phe He Leu Asp Tyr Asp Gin Ser Pro Ala Gly Cys 
325 330 335 

Arg Asp Ala Leu Leu Gin Leu Thr Ser Gly Met Val Gin Thr His Val 
340 345 350 

Thr Thr Pro Gly Ser He Pro Thr He Cys Asp Leu Ala Arg Thr Phe 
355 360 365 

Ala Arg Glu Met Gly Glu Ala Asn 
370 375 





<210> 15 
<211> 1131 
<212> DNA 

<213> Herpes simplex virus 1 

<220> 
<221> CDS 
f/<222> (1) . . (1128) 
<223> coding for thymidine kinase (TK) 

<400> 15 

atg get teg tac ccc tgc cat caa cac gcg tct gcg ttc gac cag get 48 

Met Ala Ser Tyr Pro Cys His Gin His Ala Ser Ala Phe Asp Gin Ala 
15 10 15 

gcg cgt tct cgc ggc cat age aac cga cgt acg gcg ttg cgc cct cgc 96 
Ala Arg Ser Arg Gly His Ser Asn Arg Arg Thr Ala Leu Arg Pro Arg 
20 25 30 

egg cag caa gaa gec acg gaa gtc cgc ctg gag cag aaa atg ccc acg 144 
Arg Gin Gin Glu Ala Thr Glu Val Arg Leu Glu Gin Lys Met Pro Thr 
35 40 45 

eta ctg egg gtt tat ata gac ggt cct cac ggg atg ggg aaa ace ace 192 
Leu Leu Arg Val Tyr He Asp Gly Pro His Gly Met Gly Lys Thr Thr 
50 55 60 

acc acg caa ctg ctg gtg gee ctg ggt teg cgc gac gat ate gtc tac 240 
Thr Thr Gin Leu Leu Val Ala Leu Gly Ser Arg Asp Asp He Val Tyr 
65 70 75 80 

gta ccc gag ccg atg act tac tgg cag gtg ctg ggg get tec gag aca 288 
Val Pro Glu Pro Met Thr Tyr Trp Gin Val Leu Gly Ala Ser Glu Thr 

85 90 95 

ate gcg aac ate tac acc aca caa cac cgc etc gac cag ggt gag ata 33 6 
He Ala Asn He Tyr Thr Thr Gin His Arg Leu Asp Gin Gly Glu He 
100 105 110 

teg gee ggg gac gcg gcg gtg gta atg aca age gee cag ata aca atg 3 84 
Ser Ala Gly Asp Ala Ala Val Val Met Thr Ser Ala Gin He Thr Met 
115 120 125 

ggc atg cct tat gee gtg acc gac gec gtt ctg get cct cat gtc ggg 432 
Gly Met Pro Tyr Ala Val Thr Asp Ala Val Leu Ala Pro His Val Gly 
130 135 140 

ggg gag get ggg agt tea cat gee ccg ccc ccg gee etc acc etc ate 480 
Gly Glu Ala Gly Ser Ser His Ala Pro Pro Pro Ala Leu Thr Leu He 
145 150 155 160 



BASF Plant Science GmbH 



20020471 



PP 53790 DE 





22 

ttc gac cgc cat ccc ate gec gec etc ctg tgc tac ccg gec gcg cga 528 
Phe Asp Arg His Pro lie Ala Ala Leu Leu Cys Tyr Pro Ala Ala Arg 
165 170 175 

tac ctt atg ggc age atg ace ccc cag gee gtg ctg gcg ttc gtg gec 576 
Tyr Leu Met Gly Ser Met Thr Pro Gin Ala Val Leu Ala Phe Val Ala 
180 185 190 

etc ate ccg ccg ace ttg ccc ggc aca aac ate gtg ttg ggg gee ctt 624 
Leu lie Pro Pro Thr Leu Pro Gly Thr Asn lie Val Leu Gly Ala Leu 
195 200 205 

ccg gag gac aga cac ate gac cgc ctg gec aaa cgc cag cgc ccc ggc 672 
Pro Glu Asp Arg His lie Asp Arg Leu Ala Lys Arg Gin Arg Pro Gly 
210 215 220 

gag egg ctt gac ctg get atg ctg gec gcg att cgc cgc gtt tac ggg 720 
Glu Arg Leu Asp Leu Ala Met Leu Ala Ala lie Arg Arg Val Tyr Gly 
225 ' 230 235 240 

ctg ctt gee aat acg gtg egg tat ctg cag ggc ggc ggg teg tgg tgg 7 68 
Leu Leu Ala Asn Thr Val Arg Tyr Leu Gin Gly Gly Gly Ser Trp Trp 
245 250 255 

gag gat tgg gga cag ctt teg ggg acg gec gtg ccg ccc cag ggt gec 816 
Glu Asp Trp Gly Gin Leu Ser Gly Thr Ala Val Pro Pro Gin Gly Ala 
260 265 270 

gag ccc cag age aac gcg ggc cca cga ccc cat ate ggg gac acg tta 864 
Glu Pro Gin Ser Asn Ala Gly Pro Arg Pro His lie Gly Asp Thr Leu 
275 280 285 

ttt acc ctg ttt egg gee ccc gag ttg ctg gee ccc aac ggc gac ctg 912 
Phe Thr Leu Phe Arg Ala Pro Glu Leu Leu Ala Pro Asn Gly Asp Leu 
290 295 300 

tat aac gtg ttt gee tgg gee ttg gac gtc ttg gee aaa cgc etc cgt 960 
Tyr Asn Val Phe Ala Trp Ala Leu Asp Val Leu Ala Lys Arg Leu Arg 
305 310 315 320 

ccc atg cac gtc ttt ate ctg gat tac gac caa teg ccc gee ggc tgc 
Pro Met His Val Phe lie Leu Asp Tyr Asp Gin Ser Pro Ala Gly Cys 
325 330 335 

egg gac gee ctg ctg caa ctt acc tec ggg atg gtc cag acc cac gtc 
Arg Asp Ala Leu Leu Gin Leu Thr Ser Gly Met Val Gin Thr His Val 
340 345 350 

acc acc cca ggc tec ata ccg acg ate tgc gac ctg gcg cgc acg ttt 1104 
Thr Thr Pro Gly Ser He Pro Thr He Cys Asp Leu Ala Arg Thr Phe 
355 360 365 

gec egg gag atg ggg gag get aac tga 1131 
Ala Arg Glu Met Gly Glu Ala Asn 
370 375 

<210> 16 
<211> 376 
<212> PRT 

<213> Herpes simplex virus 1 
<400> 16 

Met Ala Ser Tyr Pro Cys His Gin His Ala Ser Ala Phe Asp Gin Ala 
15 10 15 

Ala Arg Ser Arg Gly His Ser Asn Arg Arg Thr Ala Leu Arg Pro Arg 
20 25 30 
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Arg Gin Gin Glu Ala Thr Glu Val Arg Leu Glu Gin Lys Met Pro Thr 
35 40 45 

Leu Leu Arg Val Tyr lie Asp Gly Pro His Gly Met Gly Lys Thr Thr 
50 55 60 

Thr Thr Gin Leu Leu Val Ala Leu Gly Ser Arg Asp Asp lie Val Tyr 
65 70 75 80 

Val Pro Glu Pro Met Thr Tyr Trp Gin Val Leu Gly Ala Ser Glu Thr 

85 90 95 

He Ala Asn He Tyr Thr Thr Gin His Arg Leu Asp Gin Gly Glu He 
100 105 110 

Ser Ala Gly Asp Ala Ala Val Val Met Thr Ser Ala Gin He Thr Met 
115 120 125 

Gly Met Pro Tyr Ala Val Thr Asp Ala Val Leu Ala Pro His Val Gly 
130 135 140 

Gly Glu Ala Gly Ser Ser His Ala Pro Pro Pro Ala Leu Thr Leu He 
145 150 155 160 

Phe Asp Arg His Pro He Ala Ala Leu Leu Cys Tyr Pro Ala Ala Arg 
165 170 175 

Tyr Leu Met Gly Ser Met Thr Pro Gin Ala Val Leu Ala Phe Val Ala 
180 185 190 

Leu He Pro Pro Thr Leu Pro Gly Thr Asn He Val Leu Gly Ala Leu 
195 200 205 

Pro Glu Asp Arg His He Asp Arg Leu Ala Lys Arg Gin Arg Pro Gly 
210 215 220 

Glu Arg Leu Asp Leu Ala Met Leu Ala Ala He Arg Arg Val Tyr Gly 
225 230 235 240 

Leu Leu Ala Asn Thr Val Arg Tyr Leu Gin Gly Gly Gly Ser Trp Trp 
245 250 255 

Glu Asp Trp Gly Gin Leu Ser Gly Thr Ala Val Pro Pro Gin Gly Ala 
260 265 270 

Glu Pro Gin Ser Asn Ala Gly Pro Arg Pro His He Gly Asp Thr Leu 
275 280 285 

Phe Thr Leu Phe Arg Ala Pro Glu Leu Leu Ala Pro Asn Gly Asp Leu 
290 295 300 

Tyr Asn Val Phe Ala Trp Ala Leu Asp Val Leu Ala Lys Arg Leu Arg 
305 310 315 320 

Pro Met His Val Phe He Leu Asp Tyr Asp Gin Ser Pro Ala Gly Cys 
325 330 335 

Arg Asp Ala Leu Leu Gin Leu Thr Ser Gly Met Val Gin Thr His Val 
340 345 350 

Thr Thr Pro Gly Ser He Pro Thr He Cys Asp Leu Ala Arg Thr Phe 
355 360 365 

Ala Arg Glu Met Gly Glu Ala Asn 
370 375 



<210> 17 
<211> 840 
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48 



96 



<212> DNA 

<213> Toxoplasma gondii 

<220> 
<221> CDS 
<222> (1) . . (837) 

<223> coding for hypoxanthine-xanthine-guanine 
phosphoribosyl transferase (HXGPRTase) 

<400> 17 

atg gcg tec aaa ccc att gaa gaa tec egg teg caa aaa egg agt gee 
Met Ala Ser Lys Pro lie Glu Glu Ser Arg Ser Gin Lys Arg Ser Ala 

15 10 15 

ttc tea gac ate ttc tgt tgf tgc act cct aat gaa ggg get ate gtg 
Phe Ser Asp He Phe Cys Cys Cys Thr Pro Asn Glu Gly Ala He Val 

20 25 30 

ccc agt gac cca atg gtc tec ace agt get cca gca cgc ace agt get 144 
Pro Ser Asp Pro Met Val Ser Thr Ser Ala Pro Ala Arg Thr Ser Ala 

35 40 45 

cca gcg cgc tec agt gca ctt caa gac tac ggc aag ggc aag ggc cgt 192 
Pro Ala Arg Ser Ser Ala Leu Gin Asp Tyr Gly Lys Gly Lys Gly Arg 

50 55 60 

att gag ccc atg tat ate ccc gac aac ace ttc tac aac get gat gac 240 
He Glu Pro Met Tyr He Pro Asp Asn Thr Phe Tyr Asn Ala Asp Asp 
65 70 75 80 

ttt ctt gtg ccc ccc cac tgc aag ccc tac att gac aaa ate etc etc 2 88 
Phe Leu Val Pro Pro His Cys Lys Pro Tyr He Asp Lys He Leu Leu 

85 90 95 

cct ggt gga ttg gtc aag gac aga gtt gag aag ttg gcg tat gac ate 336 
Pro Gly Gly Leu Val Lys Asp Arg Val Glu Lys Leu Ala Tyr Asp He 

100 105 HO 

cac aga act tac ttc ggc gag gag ttg cac ate att tgc ate ctg aaa 
His Arg Thr Tyr Phe Gly Glu Glu Leu His He He Cys He Leu Lys 

115 120 125 

ggc tct cgc ggc ttc ttc aac ctt ctg ate gac tac ctt gee ace ata 
Gly Ser Arg Gly Phe Phe Asn Leu Leu He Asp Tyr Leu Ala Thr He 

130 ** 135 140 

cag aag tac agt ggt cgt gag tec age gtg ccc ccc ttc ttc gag cac 
Gin Lys Tyr Ser Gly Arg Glu Ser Ser Val Pro Pro Phe Phe Glu His 
145 "* 150 155 160 

tat gtc cgc ctg aag tec tac cag aac gac aac age aca ggc cag etc 
Tyr Val Arg Leu Lys Ser Tyr Gin Asn Asp Asn Ser Thr Gly Gin Leu 

165 170 175 

ace gtc ttg age gac gac ttg tea ate ttt cgc gac aag cac gtt ctg 
Thr Val Leu Ser Asp Asp Leu Ser He Phe Arg Asp Lys His Val Leu 

180 185 190 

att gtt gag gac ate gtc gac ace ggt ttc ace etc ace gag ttc ggt 
He Val Glu Asp He Val Asp Thr Gly Phe Thr Leu Thr Glu Phe Gly 

195 200 205 

gag cgc ctg aaa gee gtc ggt ccc aag teg atg aga ate gee ace etc 
Glu Arg Leu Lys Ala Val Gly Pro Lys Ser Met Arg He Ala Thr Leu 

210 215 220 

gtc gag aag cgc aca gat cgc tec aac age ttg aag ggc gac ttc gtc 
Val Glu Lys Arg Thr Asp Arg Ser Asn Ser Leu Lys Gly Asp Phe Val 
225 ~ 230 235 240 



384 



432 



480 



528 



576 



624 



672 



720 
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ggc ttc age att gaa gac gtc tgg ate gtt ggt tgc tgc tac gac ttc 7 68 

Gly Phe Ser lie Glu Asp Val Trp He Val Gly Cys Cys Tyr Asp Phe 
245 250 255 

aac gag atg ttc cgc gac ttc gac cac gtc gec gtc ctg age gac gee 816 
Asn Glu Met Phe Arg Asp Phe Asp His Val Ala Val Leu Ser Asp Ala 
260 265 270 

get cgc aaa aag ttc gag aag taa 840 
Ala Arg Lys Lys Phe Glu Lys 
275 

<210> 18 
<211> 279 
<212> PRT 

<213> Toxoplasma gondii 
<400> 18 

Met Ala Ser Lys Pro He Glu Glu Ser Arg Ser Gin Lys Arg Ser Ala 
15 10 15 

Phe Ser Asp He Phe Cys Cys Cys Thr Pro Asn Glu Gly Ala He Val 
20 25 30 

Pro Ser Asp Pro Met Val Ser Thr Ser Ala Pro Ala Arg Thr Ser Ala 
35 40 45 

Pro Ala Arg Ser Ser Ala Leu Gin Asp Tyr Gly Lys Gly Lys Gly Arg 
50 55 60 

He Glu Pro Met Tyr He Pro Asp Asn Thr Phe Tyr Asn Ala Asp Asp 
65 70 75 80 

Phe Leu Val Pro Pro His Cys Lys Pro Tyr He Asp Lys He Leu Leu 

85 90 95 

Pro Gly Gly Leu Val Lys Asp Arg Val Glu Lys Leu Ala Tyr Asp He 
100 105 110 

His Arg Thr Tyr Phe Gly Glu Glu Leu His He He Cys He Leu Lys 
115 120 125 

Gly Ser Arg Gly Phe Phe Asn Leu Leu He Asp Tyr Leu Ala Thr He 
130 135 140 

Gin Lys Tyr Ser Gly Arg Glu Ser Ser Val Pro Pro Phe Phe Glu His 
145 150 155 160 

Tyr Val Arg Leu Lys Ser Tyr Gin Asn Asp Asn Ser Thr Gly Gin Leu 
165 170 175 

Thr Val Leu Ser Asp Asp Leu Ser He Phe Arg Asp Lys His Val Leu 
180 185 190 

He Val Glu Asp He Val Asp Thr Gly Phe Thr Leu Thr Glu Phe Gly 
195 200 205 

Glu Arg Leu Lys Ala Val Gly Pro Lys Ser Met Arg He Ala Thr Leu 
210 215 220 

Val Glu Lys Arg Thr Asp Arg Ser Asn Ser Leu Lys Gly Asp Phe Val 
225 230 235 . 240 

Gly Phe Ser He Glu Asp Val Trp He Val Gly Cys Cys Tyr Asp Phe 
245 250 255 

Asn Glu Met Phe Arg Asp Phe Asp His Val Ala Val Leu Ser Asp Ala 
260 265 270 
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Ala Arg Lys Lys Phe Glu Lys 
275 

<210> 19 
<211> 459 
<212> DNA 

<213> Escherichia coli 

<220> 

<221> CDS 

<222> (1) . . (456) 

<223> coding for xanthine-guanine phosphor ibosyl 
transferase (gpt) 

<400> 19 

atg age gaa aaa tac ate gtc acc tgg gac atg ttg cag ate cat gca 48 

Met Ser Glu Lys Tyr lie Val Thr Trp Asp Met Leu Gin lie His Ala 
15 10 15 

cgt aaa etc gca age cga ctg atg cct tct gaa caa tgg aaa ggc att 96 
Arg Lys Leu Ala Ser Arg Leu Met Pro Ser Glu Gin Trp Lys Gly lie 
20 25 30 



att gec gta age cgt ggc ggt ctg gta 
lie Ala Val Ser Arg Gly Gly Leu Val 
35 40 

gaa ctg ggt att cgt cat gtc gat acc 
Glu Leu Gly lie Arg His Val Asp Thr 
50 55 

cac gac aac cag cgc gag ctt aaa gtg 
His Asp Asn Gin Arg Glu Leu Lys Val 
65 70 

ggc gaa ggc ttc ate gtt att gat gac 
Gly Glu Gly Phe lie Val lie Asp Asp 

85 

gcg gtt gcg att cgt gaa atg tat cca 
Ala Val Ala lie Arg Glu Met Tyr Pro 
100 105 

ttc gca aaa ccg get ggt cgt ccg 
Phe Ala Lys Pro Ala Gly Arg Pro 
115 120 

ate ccg caa gat acc tgg att gaa cag 
lie Pro Gin Asp Thr Trp lie Glu Gin 
130 135 

ttc gtc ccg cca ate tec ggt cgc taa 
Phe Val Pro Pro lie Ser Gly Arg 
145 150 

<210> 20 
<211> 152 
<212> PRT 

<213> Escherichia coli 



ccg ggt gcg tta ctg gcg cgt 144 
Pro Gly Ala Leu Leu Ala Arg 
45 

gtt tgt att tec age tac gat 192 
Val Cys lie Ser Ser Tyr Asp 
60 

ctg aaa cgc gca gaa ggc gat 240 
Leu Lys Arg Ala Glu Gly Asp 
75 80 

ctg gtg gat acc ggt ggt act 288 
Leu Val Asp Thr Gly Gly Thr 
90 95 

aaa gcg cac ttt gtc acc ate 33 6 
Lys Ala His Phe Val Thr lie 
110 



ccg tgg gat atg ggc gtc gta 432 
Pro Trp Asp Met Gly Val Val 
140 

459 



ctg gtt gat gac tat gtt gtt gat 3 84 
Leu Val Asp Asp Tyr Val Val Asp 
125 



<400> 20 

Met Ser Glu Lys Tyr lie Val Thr Trp Asp Met Leu Gin lie His Ala 
15 10 15 

Arg Lys Leu Ala Ser Arg Leu Met Pro Ser Glu Gin Trp Lys Gly lie 
20 25 30 
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He 


Ala 


Val 
35 


Ser Arg Gly Gly Leu Val 

40 


Pro 


Gly 


Ala 


Leu 
45 


Leu Ala 


Arg 


Glu 


Leu 
50 


Gly 


He 


Arg 


His Val 
55 


Asp 


Thr 


Val 


Cys 


He 
60 


Ser 


Ser Tyr 


Asp 


His 
65 


Asp 


Asn 


Gin 


Arg 


Glu Leu 
70 


Lys 


Val 


Leu 


Lys 
75 


Arg 


Ala 


Glu Gly 


Asp 
80 


Gly Glu 


Gly 


Phe 


He 
85 


Val He 


Asp 


Asp 


Leu 
90 


Val 


Asp 


Thr 


Gly Gly 
95 


Thr 


Ala 


Val 


Ala 


He 
100 


Arg 


Glu Met 


Tyr 


Pro 
105 


Lys 


Ala 


His 


Phe 


Val Thr 
110 


He 


Phe 


Ala 


Lys 
115 


Pro 


Ala 


Gly Arg 


Pro 
120 


Leu 


Val 


Asp 


Asp 


Tyr 
125 


Val Val 


Asp 


He 


Pro 
130 


Gin 


Asp 


Thr 


Trp He 
135 


Glu 


Gin 


Pro 


Trp 


Asp 
140 


Met 


Gly Val 


Val 


Phe 
145 


Val 


Pro 


Pro 


He 


Ser Gly Arg 
150 



















48 



96 



<210> 21 
<211> 459 
<212> DNA 

<213> Escherichia coli 

<220> 
<221> CDS 
<222> (1) . . (456) 

<223> coding for xanthine-guanine phosphoribosyl 
transferase (gpt) 

<400> 21 

atg age gaa aaa tac ate gtc acc tgg gac atg ttg cag ate cat gca 
Met Ser Glu Lys Tyr He Val Thr Trp Asp Met Leu Gin He His Ala 

15 10 15 

cgt aaa etc gca age cga ctg atg cct tct gaa caa tgg aaa ggc att 
Arg Lys Leu Ala Ser Arg Leu Met Pro Ser Glu Gin Trp Lys Gly He 

20 ~ 25 30 

att gee gta age cgt ggc ggt ctg gta ccg ggt gcg tta ctg gcg cgt 
He Ala Val Ser Arg Gly Gly Leu Val Pro Gly Ala Leu Leu Ala Arg 

35 40 45 

gaa ctg ggt att cgt cat gtc gat acc gtt tgt att tec age tac gat 
Glu Leu Gly He Arg His Val Asp Thr Val Cys He Ser Ser Tyr Asp 

50 55 60 

cac gac aac cag cgc gag ctt aaa gtg ctg aaa cgc gca gaa ggc gat 
His Asp Asn Gin Arg Glu Leu Lys Val Leu Lys Arg Ala Glu Gly Asp 
65 70 75 80 

ggc gaa ggc ttc ate gtt att gat gac ctg gtg gat acc ggt ggt act 
Gly Glu Gly Phe He Val He Asp Asp Leu Val Asp Thr Gly Gly Thr 

85 90 95 

gcg gtt gcg att cgt gaa atg tat cca aaa gcg cac ttt gtc acc ate 336 
Ala Val Ala He Arg Glu Met Tyr Pro Lys Ala His Phe Val Thr He 

100 105 HO 

ttc gca aaa ccg get ggt cgt ccg ctg gtt gat gac tat gtt gtt gat 384 
Phe Ala Lys Pro Ala Gly Arg Pro Leu Val Asp Asp Tyr Val Val Asp 
115 120 125 



144 



192 



240 



288 
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ate ccg caa gat acc tgg att gaa cag ccg tgg gat atg ggc gtc gta 
lie Pro Gin Asp Thr Trp lie Glu Gin Pro Trp Asp Met Gly Val Val 
130 135 140 

ttc gtc ccg cca ate tec ggt cgc taa 
Phe Val Pro Pro He Ser Gly Arg 
145 150 

<210> 22 
<211> 152 
<212> PRT 

<213> Escherichia coli 

<400> 22 . 
Met Ser Glu Lys Tyr He Val Thr Trp Asp Met Leu Gin He His Ala 
1 5 10 15 

Arg Lys Leu Ala Ser Arg Leu Met Pro Ser Glu Gin Trp Lys Gly He 

20 25 30 

He Ala Val Ser Arg Gly Gly Leu Val Pro Gly Ala Leu Leu Ala Arg 

35 . 40 45 

Glu Leu Gly He Arg His Val Asp Thr Val Cys He Ser Ser Tyr Asp 

50 55 60 
His Asp Asn Gin Arg Glu Leu Lys Val Leu Lys Arg Ala Glu Gly Asp 

65 70 75 80 

Gly Glu Gly Phe He Val He Asp Asp Leu Val Asp Thr Gly Gly Thr 

85 90 95 

Ala Val Ala He Arg Glu Met Tyr Pro Lys Ala His Phe Val Thr He 

100 105 HO 

Phe Ala Lys Pro Ala Gly Arg Pro Leu Val Asp Asp Tyr Val Val Asp 

115 120 125 

He Pro Gin Asp Thr Trp He Glu Gin Pro Trp Asp Met Gly Val Val 
130 ~ 135 140 

Phe Val Pro Pro He Ser Gly Arg 
145 150 



432 



459 




<210> 23 
<211> 720 
<212> DNA 

<213> Escherichia coli 

<220> 

<221> CDS 

<222> (1) . . (717) 

<223> coding for purine nucleoside phosphorylase (deoD) 
<400> 23 

atg get acc cca cac att aat gca gaa atg ggc gat ttc get gac gta 48 
Met Ala Thr Pro His He Asn Ala Glu Met Gly Asp Phe Ala Asp Val 

15 10 I 5 

gtt ttg atg cca ggc gac ccg ctg cgt gcg aag tat att get gaa act 96 
Val Leu Met Pro Gly Asp Pro Leu Arg Ala Lys Tyr He Ala Glu Thr 
20 25 30 

ttc ctt gaa gat gee cgt gaa gtg aac aac gtt cgc ggt atg ctg ggc 144 
Phe Leu Glu Asp Ala Arg Glu Val Asn Asn Val Arg Gly Met Leu Gly 
35 " 40 45 



BASF Plant Science GmbH 



20020471 



PF 53790 DE 





29 

ttc acc ggt act tac aaa ggc cgc aaa att tec gta atg ggt cac ggt 192 
Phe Thr Gly Thr Tyr Lys Gly Arg Lys He Ser Val Met Gly His Gly 

50 55 60 

atg ggt ate ccg tec tgc tec ate tac acc aaa gaa ctg ate acc gat 240 
Met Gly He Pro Ser Cys Ser He Tyr Thr Lys Glu Leu He Thr Asp 
65 " 70 75 80 

ttc ggc gtg aag aaa att ate cgc gtg ggt tec tgt ggc gca gtt ctg 2 88 
Phe Gly Val Lys Lys He He Arg Val Gly Ser Cys Gly Ala Val Leu 

85 90 95 

ccg cac gta aaa ctg cgc gac gtc gtt ate ggt atg ggt gee tgc acc 33 6 
Pro His Val Lys Leu Arg Asp Val Val He Gly Met Gly Ala Cys Thr 
100 105 110 

gat tec aaa gtt aac cgc ate cgt ttt aaa gac cat gac ttt gee get 3 84 
Asp Ser Lys Val Asn Arg He Arg Phe Lys Asp His Asp Phe Ala Ala 
115 120 125 

ate get gac ttc gac atg gtg cgt aac gca gta gat gca get aaa gca 432 
He Ala Asp Phe Asp Met Val Arg Asn Ala Val Asp Ala Ala Lys Ala 
130 135 140 

ctg ggt att gat get cgc gtg ggt aac ctg ttc tec get gac ctg ttc 480 
Leu Gly He Asp Ala Arg Val Gly Asn Leu Phe Ser Ala Asp Leu Phe 
145 " 150 155 160 

tac tct ccg gac ggc gaa atg ttc gac g$.g atg gaa aaa tac ggc att 528 
Tyr Ser Pro Asp Gly Glu Met Phe Asp Val Met Glu Lys Tyr Gly He 
165 170 175 

etc ggc gtg gaa atg gaa gcg get ggt ate tac ggc gtc get gca gaa 576 
Leu Gly Val Glu Met Glu Ala Ala Gly He Tyr Gly Val Ala Ala Glu 
180 185 190 

ttt ggc gcg aaa gee ctg acc ate tgc acc gta tct gac cac ate cgc 624 
Phe Gly Ala Lys Ala Leu Thr He Cys Thr Val Ser Asp His He Arg 
195 200 205 

act cac gag cag acc act gee get gag cgt cag act acc ttc aac gac 672 
Thr His Glu Gin Thr Thr Ala Ala Glu Arg Gin Thr Thr Phe Asn Asp 
210 215 220 

atg ate aaa ate gca ctg gaa tec gtt ctg ctg ggc gat aaa gag taa 720 
Met He Lys He Ala Leu Glu Ser Val Leu Leu Gly Asp Lys Glu 
225 230 235 

<210> 24 
<211> 239 
<212> PRT 

<213> Escherichia coli 
<400> 24 

Met Ala Thr Pro His He Asn Ala Glu Met Gly Asp Phe Ala Asp Val 
15 10 15 

Val Leu Met Pro Gly Asp Pro Leu Arg Ala Lys Tyr He Ala Glu Thr 
20 25 30 

Phe Leu Glu Asp Ala Arg Glu Val Asn Asn Val Arg Gly Met Leu Gly 
35 40 45 

Phe Thr Gly Thr Tyr Lys Gly Arg Lys He Ser Val Met Gly His Gly 
50 55 60 

Met Gly He Pro Ser Cys Ser He Tyr Thr Lys Glu Leu He Thr Asp 
65 70 75 80 
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Phe Gly Val Lys Lys He He Arg Val Gly Ser Cys Gly Ala Val Leu 

85 90 95 

Pro His Val Lys Leu Arg Asp Val Val He Gly Met Gly Ala Cys Thr 

100 105 HO 

Asp Ser Lys Val Asn Arg He Arg Phe Lys Asp His Asp Phe Ala Ala 

115 120 125 

He Ala Asp Phe Asp Met Val Arg Asn Ala Val Asp Ala Ala Lys Ala 

130 135 140 

Leu Gly He Asp Ala Arg Val Gly Asn Leu Phe Ser Ala Asp Leu Phe 
145 150 155 160 

Tyr Ser Pro Asp Gly Glu Met Phe Asp Val Met Glu Lys Tyr Gly He 

165 170 175 

Leu Gly Val Glu Met Glu Ala Ala Gly He Tyr Gly Val Ala Ala Glu 

180 185 190 

Phe Gly Ala Lys Ala Leu Thr He Cys Thr Val Ser Asp His He Arg 

195 200 205 

Thr His Glu Gin Thr Thr Ala Ala Glu Arg Gin Thr Thr Phe Asn Asp 
210 215 220 

^ Met He Lys He Ala Leu Glu Ser Val Leu Leu Gly Asp Lys Glu 
225 " 230 235 




48 



96 



<210> 25 
<211> 1545 
<212> DNA 

<213> Burkholderia caryophylli 

<220> 
<221> CDS 
<222> (1) . . (1542) 

<223> coding for phosphonate monoester hydrolase (pehA) 
<400> 25 

atg acc aga aaa aat gtc ctg ctt ate gtc gtt gat caa tgg cga gca 
Met Thr Arg Lys Asn Val Leu Leu He Val Val Asp Gin Trp Arg Ala 

15 10 15 

gat ttt ate cct cac ctg atg egg gcg gag ggg cgc gaa cct ttc ctt 
Asp Phe He Pro His Leu Met Arg Ala Glu Gly Arg Glu Pro Phe Leu 

20 25 30 

aaa act ccc aat ctt gat cgt ctt tgc egg gaa ggc ttg acc ttc cgc 144 
Lys Thr Pro Asn Leu Asp Arg Leu Cys Arg Glu Gly Leu Thr Phe Arg 

35 40 45 

aat cat gtc acg acg tgc gtg ccg tgt ggt ccg gca agg gca age ctg 
Asn His Val Thr Thr Cys Val Pro Cys Gly Pro Ala Arg Ala Ser Leu 

50 55 60 

ctg acg ggc etc tac ctg atg aac cac egg gcg gtg cag aac act gtt 
Leu Thr Gly Leu Tyr Leu Met Asn His Arg Ala Val Gin Asn Thr Val 
65 ' 70 75 80 

ccg ctt gac cag cgc cat eta aac ctt ggc aag gec ctg cgc gee att 
Pro Leu Asp Gin Arg His Leu Asn Leu Gly Lys Ala Leu Arg Ala He 

85 90 95 

ggc tac gat ccc gcg etc att ggt tac acc acc acg aca cct gat ccg 33 6 
Gly Tyr Asp Pro Ala Leu He Gly Tyr Thr Thr Thr Thr Pro Asp Pro 
100 105 HO 



192 



240 



288 
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cgc aca acc tct gca agg gat ccg cgt ttc acg gtc ctg ggc gac ate 384 

Arg Thr Thr Ser Ala Arg Asp Pro Arg Phe Thr Val Leu Gly Asp lie 

115 120 125 

atg gac ggc ttt cgt teg gtc ggc gca ttc gag ccc aat atg gag ggg 432 
Met Asp Gly Phe Arg Ser Val Gly Ala Phe Glu Pro Asn Met Glu Gly 
130 135 140 

tat ttt ggc tgg gtg gcg cag aac ggc ttc gaa ctg cca gag aac cgc 480 
Tyr Phe Gly Trp Val Ala Gin Asn Gly Phe Glu Leu Pro Glu Asn Arg 
145 150 155 160 

gaa gat ate tgg ctg ccg gaa ggt gaa cat tec gtt ccc ggt get acc 528 
Glu Asp lie Trp Leu Pro Glu Gly Glu His Ser Val Pro Gly Ala Thr 
165 170 175 

gac aaa ccg teg cgc att ccg aag gaa ttt teg gat teg aca ttc ttc 57 6 
Asp Lys Pro Ser Arg lie Pro Lys Glu Phe Ser Asp Ser Thr Phe Phe 
180 185 190 

acg gag cgc gee ctg aca tat ctg aag ggc agg gac ggc aag cct ttc 624 
Thr Glu Arg Ala Leu Thr Tyr Leu Lys Gly Arg Asp Gly Lys Pro Phe 
195 200 205 

ttc ctg cat ctt ggc tat tat cgc ccg cat ccg cct ttc gta gee tec 672 
Phe Leu His Leu Gly Tyr Tyr Arg Pro His Pro Pro Phe Val Ala Ser 
210 215 220 

gcg ccc tac cat gcg atg tac aaa gee gaa gat atg cct gcg cct ata 720 
Ala Pro Tyr His Ala Met Tyr Lys Ala Glu Asp Met Pro Ala Pro lie 
225 230 235 240 

cgt gcg gag aat ccg gat gec gaa gcg gca cag cat ccg etc atg aag 7 68 
Arg Ala Glu Asn Pro Asp Ala Glu Ala Ala Gin His Pro Leu Met Lys 
245 250 255 

cac tat ate gac cac ate aga cgc ggc teg ttc ttc cat ggc gcg gaa 816 
His Tyr lie Asp His lie Arg Arg Gly Ser Phe Phe His Gly Ala Glu 
260 265 270 

ggc teg gga gca acg ctt gat gaa ggc gaa att cgc cag atg cgc get 864 
Gly Ser Gly Ala Thr Leu Asp Glu Gly Glu lie Arg Gin Met Arg Ala 
275 280 285 

aca tat tgc gga ctg ate acc gag ate gac gat tgt ctg ggg agg gtc 912 
Thr Tyr Cys Gly Leu lie Thr Glu lie Asp Asp Cys Leu Gly Arg Val 
290- 295 300 

ttt gee tat etc gat gaa acc ggt cag tgg gac gac acg ctg att ate 960 
Phe Ala Tyr Leu Asp Glu Thr Gly Gin Trp Asp Asp Thr Leu He He 
305 310 315 320 

ttc acg age gat cat ggc gaa caa ctg ggc gat cat cac ctg etc ggc • 1008 
Phe Thr Ser Asp His Gly Glu Gin Leu Gly Asp His His Leu Leu Gly 
325 330 335 

aag ate ggt tac aat gee gaa age ttc cgt att ccc ttg gtc ata aag 105 6 
Lys He Gly Tyr Asn Ala Glu Ser Phe Arg He Pro Leu Val He Lys 
340 345 350 

gat gcg gga cag aac egg cac gee ggc cag ate gaa gaa ggc ttc tec 1104 
Asp Ala Gly Gin Asn Arg His Ala Gly Gin He Glu Glu Gly Phe Ser 
355 360 365 

gaa age ate gac gtc atg ccg acc ate etc gaa tgg ctg ggc ggg gaa 1152 
Glu Ser He Asp Val Met Pro Thr He Leu Glu Trp Leu Gly Gly Glu 
370 375 380 
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acg cct cgc gcc tgc gac ggc cgt teg ctg ttg ccg ttt ctg get gag 1200 
Thr Pro Arg Ala Cys Asp Gly Arg Ser Leu Leu Pro Phe Leu Ala Glu 
385 390 395 400 

gga aag ccc tec gac tgg cgc acg gaa eta cat tac gag ttc gat ttt 1248 
Gly Lys Pro Ser Asp Trp Arg Thr Glu Leu His Tyr Glu Phe Asp Phe 
405 410 415 

cgc gat gtc ttc tac gat cag ccg cag aac teg gtc cag ctt tec cag 1296 
Arg Asp Val Phe Tyr Asp Gin Pro Gin Asn Ser Val Gin Leu Ser Gin 
420 425 43 0 

gat gat tgc age etc tgt gtg ate gag gac gaa aac tac aag tac gtg 1344 
Asp Asp Cys Ser Leu Cys Val lie Glu Asp Glu Asn Tyr Lys Tyr Val 
435 440 .445 

cat ttt gcc gcc ctg ccg ccg ctg ttc ttc gat ctg aag gca gac ccg 1392 
His Phe Ala Ala Leu Pro Pro Leu Phe Phe Asp Leu Lys Ala Asp Pro 
450 455 460 

cat gaa ttc age aat ctg get ggc gat cct get tat gcg gcc etc gtt 1440 
His Glu Phe Ser Asn Leu Ala Gly Asp Pro Ala Tyr Ala Ala Leu Val 
465 470 475 480 

cgt gac tat gcc cag aag gca ttg teg tgg cga ctg tct cat gcc gac 1488 
Arg Asp Tyr Ala Gin Lys Ala Leu Ser Trp Arg Leu Ser His Ala Asp 
485 490 495 

egg aca etc ace cat tac aga tec age ccg caa ggg ctg aca acg cgc 1536 
Arg Thr Leu Thr His Tyr Arg Ser Ser Pro Gin Gly Leu Thr Thr Arg 
500 505 510 

aac cat tga 1545 
Asn His 

<210> 26 
<211> 514 
<212> PRT 

<213> Burkholderia caryophylli 
<400> 26 

Met Thr Arg Lys Asn Val Leu Leu lie Val Val Asp Gin Trp Arg Ala 
1 ~ 5 10 15 

Asp Phe lie Pro His Leu Met Arg Ala Glu Gly Arg Glu Pro Phe Leu 
20 25 30 

Lys Thr Pro Asn Leu Asp Arg Leu Cys Arg Glu Gly Leu Thr Phe Arg 
35 40 45 

Asn His Val Thr Thr Cys Val Pro Cys Gly Pro Ala Arg Ala Ser Leu 
50 55 60 

Leu Thr Gly Leu Tyr Leu Met Asn His Arg Ala Val Gin Asn Thr Val 
65 7 0 75 80 

Pro Leu Asp Gin Arg His Leu Asn Leu Gly Lys Ala Leu Arg Ala lie 

85 90 95 

Gly Tyr Asp Pro Ala Leu He Gly Tyr Thr Thr Thr Thr Pro Asp Pro 
100 105 110 

Arg Thr Thr Ser Ala Arg Asp Pro Arg Phe Thr Val Leu Gly Asp He 
115 120 125 

Met Asp Gly Phe Arg Ser Val Gly Ala Phe Glu Pro Asn Met Glu Gly 
130 135 140 
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Tyr Phe Gly Trp Val Ala Gin Asn Gly Phe Glu Leu Pro Glu Asn Arg 
145 150 155 160 

Glu Asp He Trp Leu Pro Glu Gly Glu His Ser Val Pro Gly Ala Thr 
165 170 175 

Asp Lys Pro Ser Arg He Pro Lys Glu Phe Ser Asp Ser Thr Phe Phe 
180 185 190 

Thr Glu Arg Ala Leu Thr Tyr Leu Lys Gly Arg Asp Gly Lys Pro Phe 
195 200 205 

Phe Leu His Leu Gly Tyr Tyr Arg Pro His Pro Pro Phe Val Ala Ser 

210 215 220 

Ala Pro Tyr His Ala Met Tyr Lys Ala Glu Asp Met Pro Ala Pro He 

225 ^ 230 235 240 

Arg Ala Glu Asn Pro Asp Ala Glu Ala Ala Gin His Pro Leu Met Lys 

245 250 255 

His Tyr He Asp His He Arg Arg Gly Ser Phe Phe His Gly Ala Glu 

260 265 270 

Gly Ser Gly Ala Thr Leu Asp Glu Gly Glu He Arg Gin Met Arg Ala 

275 280 285 

Thr Tyr Cys Gly Leu He Thr Glu He Asp Asp Cys Leu Gly Arg Val 

290 295 300 

Phe Ala Tyr Leu Asp Glu Thr Gly Gin Trp Asp Asp Thr Leu He He 
305 310 315 320 

Phe Thr Ser Asp His Gly Glu Gin Leu Gly Asp His His Leu Leu Gly 
325 330 335 

Lys He Gly Tyr Asn Ala Glu Ser Phe Arg He Pro Leu Val He Lys 
340 345 350 

Asp Ala Gly Gin Asn Arg His Ala Gly Gin He Glu Glu Gly Phe Ser 

355 360 365 

Glu Ser He Asp Val Met Pro Thr He Leu Glu Trp Leu Gly Gly Glu 

370 375 380 

Thr Pro Arg Ala Cys Asp Gly Arg Ser Leu Leu Pro Phe Leu Ala Glu 
385 ~ 390 395 400 

Gly Lys Pro Ser Asp Trp Arg Thr Glu Leu His Tyr Glu Phe Asp Phe 
405 410 415 

Arg Asp Val Phe Tyr Asp Gin Pro Gin Asn Ser Val Gin Leu Ser Gin 
420 425 430 

Asp Asp Cys Ser Leu Cys Val He Glu Asp Glu Asn Tyr Lys Tyr Val 

435 440 445 

His Phe Ala Ala Leu Pro Pro Leu Phe Phe Asp Leu Lys Ala Asp Pro 

450 455 460 

His Glu Phe Ser Asn Leu Ala Gly Asp Pro Ala Tyr Ala Ala Leu Val 
465 470 475 480 

Arg Asp Tyr Ala Gin Lys Ala Leu Ser Trp Arg Leu Ser His Ala Asp 
485 490 495 

Arg Thr Leu Thr His Tyr Arg Ser Ser Pro Gin Gly Leu Thr Thr Arg 
500 505 510 

Asn His 
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<210> 27 
<211> 2250 
<212> DNA 

<213> Agrobacterium rhizogenes 

<220> 
<221> CDS 
<222> (1) . . (2247) 

<223> coding for tryptophane oxygenase (auxl) 
<400> 27 

atg get gga tec tec ttc aca ttg cca tea act ggc tea gcg ccc ctt 
Met Ala Gly Ser Ser Phe Thr Leu Pro Ser Thr Gly Ser Ala Pro Leu 

! 5 10 15 

gat atg atg ctt ate gat gat tea gat ctg ctg caa ttg ggt etc cag 
Asp Met Met Leu lie Asp Asp Ser Asp Leu Leu Gin Leu Gly Leu Gin 

20 25 30 

cag gta ttc teg aag egg tac aca gag aca ccg cag tea cgc tac aaa 144 
Gin Val Phe Ser Lys Arg Tyr Thr Glu Thr Pro Gin Ser Arg Tyr Lys 

35 40 45 

ctg acc agg agg get tct cca gac gtc tea tct ggc gaa ggc aat gtg 
Leu Thr Arg Arg Ala Ser Pro Asp Val Ser Ser Gly Glu Gly Asn Val 

50 55 60 

cat gec ctt gcg ttc ata tat gtc aac get gag acg ttg cag atg ate 
His Ala Leu Ala Phe lie Tyr Val Asn Ala Glu Thr Leu Gin Met He 
65 70 75 80 

aaa aac get cga teg eta acc gaa gcg aac ggc gtc aaa gat ctt gtc 
Lys Asn Ala Arg Ser Leu Thr Glu Ala Asn Gly Val Lys Asp Leu Val 

85 90 95 

gee ate gac gtt ccg cca ttt cga aac gac ttc tea aga gcg eta etc 
Ala He Asp Val Pro Pro Phe Arg Asn Asp Phe Ser Arg Ala Leu Leu 

100 105 HO 

ctt caa gtg ate aac ttg ttg gga aac aac cga aat gee gat gac gat 
Leu Gin Val He Asn Leu Leu Gly Asn Asn Arg Asn Ala Asp Asp Asp 

115 120 125 

ctt agt cac ttc ata gca gtt get etc cca aac age gee cgc tct aag 
Leu Ser His Phe He Ala Val Ala Leu Pro Asn Ser Ala Arg Ser Lys 

130 135 140 

ate eta acc acg gca ccg ttc gaa gga age ttg tea gaa aac ttc agg 480 
He Leu Thr Thr Ala Pro Phe Glu Gly Ser Leu Ser Glu Asn Phe Arg 
145 150 155 160 

ggg ttc ccg ate act cgt gaa gga aat gtg gca tgt gaa gtg eta gee 528 
Gly Phe Pro He Thr Arg Glu Gly Asn Val Ala Cys Glu Val Leu Ala 
165 170 175 

tat ggg aat aac ttg atg ccc aag gee tgc tec gat tec ttt cca acc 576 
Tyr Gly Asn Asn Leu Met Pro Lys Ala Cys Ser Asp Ser Phe Pro Thr 
180 185 190 

gtg gat ctt ctt tat gac tat ggc aag ttc ttc gag agt tgc gcg gee 624 
Val Asp Leu Leu Tyr Asp Tyr Gly Lys Phe Phe Glu Ser Cys Ala Ala 

195 200 205 

gat gga cgt ate ggt tat ttt cct gaa ggc gtt acg aaa cct aaa gtg 672 
Asp Gly Arg He Gly Tyr Phe Pro Glu Gly Val Thr Lys Pro Lys Val 
210 215 220 



192 



240 



288 



336 



384 



432 
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get ata att ggc 
Ala He He Gly 
225 

ctt cat gca ggg 
Leu His Ala Gly 

ctt gga gga aag 
Leu Gly Gly Lys 
260 

ata gec gag atg 
He Ala Glu Met 
275 

ttc ttc tat etc 
Phe Phe Tyr Leu 
290 

aat ccg gga agt 
Asn Pro Gly Ser 
305 

ate tgg aaa gcg 
He Trp Lys Ala 

cat gga tgg cgc 
His Gly Trp Arg 
340 

atg ttg gcg tea 
Met Leu Ala Ser 
355 

eta cag cag gcg 
Leu Gin Gin Ala 
370 

cga gag tct ttc 
Arg Glu Ser Phe 
385 

cct ccg ggg ggt 
Pro Pro Gly Gly 

aaa gcg ctg ggt 
Lys Ala Leu Gly 
420 

ggg ttt ate gag 
Gly Phe He Glu 
435 

gtg egg ctg agt 
Val Arg Leu Ser 
450 

tea cag gta att 
Ser Gin Val He 
465 

caa gtc gag cag 
Gin Val Glu Gin 




gca ggc ttt 
Ala Gly Phe 
230 

gta gac gat 
Val Asp Asp 
245 

eta tgg tea 
Leu Trp Ser 

ggg gee atg 
Gly Ala Met 

aaa aag cac 
Lys Lys His 
295 

gtc gat ace 
Val Asp Thr 
310 

gga gag gag 
Gly Glu Glu 
325 

gca ttt ttg 
Ala Phe Leu 

ccg tta gca 
Pro Leu Ala 

cat ggc ttc 
His Gly Phe 
375 

tct tct ggc 
Ser Ser Gly 
390 

gaa caa tgg 
Glu Gin Trp 
405 

att gga tec 
He Gly Ser 

ate ctt cgc 
He Leu Arg 

tac gaa gga 
Tyr Glu Gly 
455 

aac ggc aga 
Asn Gly Arg 
470 

att gat aga 
He Asp Arg 
485 



35 

tec ggg etc gtt 
Ser Gly Leu Val 
235 

gtt acg gtg tat 
Val Thr Val Tyr 
250 

cac gga ttt aag 
His Gly Phe Lys 
265 

cgt ttt ccg cga 
Arg Phe Pro Arg 
280 

gga ctg gac tec 
Gly Leu Asp Ser 

gca ttg ttc tac 
Ala Leu Phe Tyr 
315 

cca ccg gag ctg 
Pro Pro Glu Leu 
330 

caa gat t;gc tat 
Gin Asp Gly Tyr 
345 

att gtt gac gee 
He Val Asp Ala 
360 

tgg caa tct tgg 
Trp Gin Ser Trp 

ate gaa aaa atg 
He Glu Lys Met 
395 

aat tec eta gat 
Asn Ser Leu Asp 
410 

ggc gga ttc ggc 
Gly Gly Phe Gly 
425 

tta gtc gtc aac 
Leu Val Val Asn 
440 

att tct gag ctg 
He Ser Glu Leu 

tct att cgc gag 
Ser He Arg Glu 
475 

gag gag gat aaa 
Glu Glu Asp Lys 
490 




gca gcg age 
Ala Ala Ser 



gag gcg agt 
Glu Ala Ser 

agt get cca 
Ser Ala Pro 
270 

agt gaa tea 
Ser Glu Ser 
285 

gtt ggt ctg 

Val Gly Leu 
300 

agg ggc cgt 

Arg Gly Arg 

ttt cgt cgt 
Phe Arg Arg 

etc cat gat 
Leu His Asp 
350 

ttg aat tta 
Leu Asn Leu 
365 

etc aca tat 
Leu Thr Tyr 
380 

ttc ttg ggc 
Phe Leu Gly 

gac ttg gat 
Asp Leu Asp 

cct gta ttt 
Pro Val Phe 
430 

ggg tat gag 
Gly Tyr Glu 
445 

cct cat agg 
Pro His Arg 
460 

cgt aca att 
Arg Thr He 

ata aat ate 
He Asn He 



gaa eta 720 
Glu Leu 
240 

gat egg 7 68 

Asp Arg 

255 

aat gtg 816 
Asn Val 

tgc ttg 8 64 
Cys Leu 

ttc ccg 912 
Phe Pro 

caa tat 960 
Gin Tyr 
320 

gtg cac 1008 

Val His 

335 

gga gtc 1056 
Gly Val 

ggg cat 1104 
Gly His 

ttt gag 1152 
Phe Glu 

aat cat 1200 
Asn His 
400 

ctt ttc 1248 

Leu Phe 

415 

gaa agt 1296 
Glu Ser 

gat aac 1344 
Asp Asn 

ate gee 1392 
He Ala 

cac gtt 1440 
His Val 
480 

aag ate 1488 

Lys He 

495 
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aaa gga gga aag gtt gag gtc tat gat cga gta ctg gtt aca tec ggg 153 6 

Lys Gly Gly Lys Val Glu Val Tyr Asp Arg Val Leu Val Thr Ser Gly 
500 505 510 

ttt gcg aac ate gaa atg cgc cat etc ctg aca tea age aac gca ttc 1584 
Phe Ala Asn lie Glu Met Arg His Leu Leu Thr Ser Ser Asn Ala Phe 
515 520 525 

ttc cat gca gat gta age cat gca ata ggg aac agt cat atg act ggt 1632 
Phe His Ala Asp Val Ser His Ala He Gly Asn Ser His Met Thr Gly 
530 535 540 

gcg tea aaa ctg ttc ttg ctg act aac gaa aaa ttc tgg eta caa cat 1680 
Ala Ser Lys Leu Phe Leu Leu Thr Asn Glu Lys Phe Trp Leu Gin His 
545 550 555 560 

cat ttg cca teg tgc ata etc acc ace ggc gtt gca aag gca gtt tat 172 8 
His Leu Pro Ser Cys He Leu Thr Thr Gly Val Ala Lys Ala Val Tyr 
565 570 575 

tgc tta gac tat gat ccg cga gat cca age ggc aaa gga ctg gtg ttg 1776 
Cys Leu Asp Tyr Asp Pro Arg Asp Pro Ser Gly Lys Gly Leu Val Leu 
580 585 590 

ata age tat act tgg gag gat gac tea cat aag etc eta gee gtc ccc 1824 
He Ser Tyr Thr Trp Glu Asp Asp Ser His Lys Leu Leu Ala Val Pro 
595 600 605 

gac aaa aga gaa agg ttc gca teg ctg cag cgc gat att ggg agg gca 1872 
Asp Lys Arg Glu Arg Phe Ala Ser Leu Gin Arg Asp He Gly Arg Ala 
610 615 620 

ttc cca gat ttt gee aag cac eta act cct gca gac ggg aac tat gat 1920 
Phe Pro Asp Phe Ala Lys His Leu Thr Pro Ala Asp Gly Asn Tyr Asp 
625 630 635 640 

gat aat ate gtt caa cat gat tgg ctg act gat ccc cac get ggc gga 19 68 
Asp Asn He Val Gin His Asp Trp Leu Thr Asp Pro His Ala Gly Gly 
645 650 655 

gcg ttt aaa ctg aac cgc aga ggc aac gac gta tat tea gaa agg ctt 2016 
Ala Phe Lys Leu Asn Arg Arg Gly Asn Asp Val Tyr Ser Glu Arg Leu 
660 665 670 

ttc ttt cag ccc ttt gac gta atg cat ccc gcg gac gat aag gga ctt 2 064 
Phe Phe Gin Pro Phe Asp Val Met His Pro Ala Asp Asp Lys Gly Leu 
675 680 685 

tac ttg gee ggt tgt age tgt tec ttc acc gga ggg tgg gtt cat ggt 2112 
Tyr Leu Ala Gly Cys Ser Cys Ser Phe Thr Gly Gly Trp Val His Gly 
690 695 700 

gee att cag acc gca tgc aac get acg tgt gcg ate att tat ggt tec 2160 
Ala He Gin Thr Ala Cys Asn Ala Thr Cys Ala He He Tyr Gly Ser 
705 710 715 720 

gga cac ctg caa gag eta ate cac tgg cga cac etc aaa gaa ggt aat 2208 
Gly His Leu Gin Glu Leu He His Trp Arg His Leu Lys Glu Gly Asn 
725 730 735 

cca ctg gcg cac get tgg aag egg tat agg tat caa gcg tga 2250 
Pro Leu Ala His Ala Trp Lys Arg Tyr Arg Tyr Gin Ala 
740 745 

<210> 28 
<211> 749 
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<212> PRT 

<213> Agrobacterimn rhizogenes 
<400> 28 

Met Ala Gly Ser Ser Phe Thr Leu Pro Ser Thr Gly Ser Ala Pro Leu 
1 5 10 15 

Asp Met Met Leu lie Asp Asp Ser Asp Leu Leu Gin Leu Gly Leu Gin 
20 25 30 

Gin Val Phe Ser Lys Arg Tyr Thr Glu Thr Pro Gin Ser Arg Tyr Lys 
35 40 45 

Leu Thr Arg Arg Ala Ser Pro Asp Val Ser Ser Gly Glu Gly Asn Val 
50 55 60 

His Ala Leu Ala Phe lie Tyr Val Asn Ala Glu Thr Leu Gin Met lie 
65 70 75 80 

Lys Asn Ala Arg Ser Leu Thr Glu Ala Asn Gly Val Lys Asp Leu Val 

85 90 95 

Ala lie Asp Val Pro Pro Phe Arg Asn Asp Phe Ser Arg Ala Leu Leu 
100 105 110 

Leu Gin Val He Asn Leu Leu Gly Asn Asn Arg Asn Ala Asp Asp Asp 
115 120 125 

Leu Ser His Phe He Ala Val Ala Leu Pro Asn Ser Ala Arg Ser Lys 
130 135 140 

He Leu Thr Thr Ala Pro Phe Glu Gly Ser Leu Ser Glu Asn Phe Arg 
145 150 155 160 

Gly Phe Pro lie Thr Arg Glu Gly Asn Val Ala Cys Glu Val Leu Ala 
165 170 175 

Tyr Gly Asn Asn Leu Met Pro Lys Ala Cys Ser Asp Ser Phe Pro Thr 
180 185 190 

Val Asp Leu Leu Tyr Asp Tyr Gly Lys Phe Phe Glu Ser Cys Ala Ala 
195 200 205 

Asp Gly Arg He Gly Tyr Phe Pro Glu Gly Val Thr Lys Pro Lys Val 
210 215 220 

Ala He He Gly Ala Gly Phe Ser Gly Leu Val Ala Ala Ser Glu Leu 
225 230 235 240 

Leu His Ala Gly Val Asp Asp Val Thr Val Tyr Glu Ala Ser Asp Arg 
245 250 255 

Leu Gly Gly Lys Leu Trp Ser His Gly Phe Lys Ser Ala Pro Asn Val 
260 265 270 

He Ala Glu Met Gly Ala Met Arg Phe Pro Arg Ser Glu Ser Cys Leu 
275 280 285 

Phe Phe Tyr Leu Lys Lys His Gly Leu Asp Ser Val Gly Leu Phe Pro 
290 295 300 

Asn Pro Gly Ser Val Asp Thr Ala Leu Phe Tyr Arg Gly Arg Gin Tyr 
305 310 315 320 

He Trp Lys Ala Gly Glu Glu Pro Pro Glu Leu Phe Arg Arg Val His 
325 330 335 

His Gly Trp Arg Ala Phe Leu Gin Asp Gly Tyr Leu His Asp Gly Val 
340 345 350 
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Met Leu Ala Ser Pro Leu Ala lie Val Asp Ala Leu Asn Leu Gly His 
355 360 365 

Leu Gin Gin Ala His Gly Phe Trp Gin Ser Trp Leu Thr Tyr Phe Glu 
370 375 380 

Arg Glu Ser Phe Ser Ser Gly lie Glu Lys Met Phe Leu Gly Asn His 
385 390 395 400 

Pro Pro Gly Gly Glu Gin Trp Asn Ser Leu Asp Asp Leu Asp Leu Phe 
405 410 415 

Lys Ala Leu Gly lie Gly Ser Gly Gly Phe Gly Pro Val Phe Glu Ser 
420 425 430 

Gly Phe lie Glu lie Leu Arg Leu Val Val Asn Gly Tyr Glu Asp Asn 
435 440 445 

Val Arg Leu Ser Tyr Glu Gly lie Ser Glu Leu Pro His Arg lie Ala 
450 455 460 

Ser Gin Val lie Asn Gly Arg Ser lie Arg Glu Arg Thr lie His Val 
465 470 475 480 

Gin Val Glu Gin lie Asp Arg Glu Glu Asp Lys lie Asn He Lys He 
485 490 495 

Lys Gly Gly Lys Val Glu Val Tyr Asp Arg Val Leu Val Thr Ser Gly 
500 505 510 

Phe Ala Asn He Glu Met Arg His Leu Leu Thr Ser Ser Asn Ala Phe 
515 520 525 

Phe His Ala Asp Val Ser His Ala lie Gly Asn Ser His Met Thr Gly 
530 535 540 

Ala Ser Lys Leu Phe Leu Leu Thr Asn Glu Lys Phe Trp Leu Gin His 
545 550 555 560 

His Leu Pro Ser Cys He Leu Thr Thr Gly Val Ala Lys Ala Val Tyr 
565 570 575 

Cys Leu Asp Tyr Asp Pro Arg Asp Pro Ser Gly Lys Gly Leu Val Leu 
580 585 590 

He Ser Tyr Thr Trp Glu Asp Asp Ser His Lys Leu Leu Ala Val Pro 
595 600 605 

Asp Lys Arg Glu Arg Phe Ala Ser Leu Gin Arg Asp He Gly Arg Ala 
610 615 620 

Phe Pro Asp Phe Ala Lys His Leu Thr Pro Ala Asp Gly Asn Tyr Asp 
625 630 635 640 

Asp Asn He Val Gin His Asp Trp Leu Thr Asp Pro His Ala Gly Gly 
645 650 655 

Ala Phe Lys Leu Asn Arg Arg Gly Asn Asp Val Tyr Ser Glu Arg Leu 
660 665 670 

Phe Phe Gin Pro Phe Asp Val Met His Pro Ala Asp Asp Lys Gly Leu 
675 680 685 

Tyr Leu Ala Gly Cys Ser Cys Ser Phe Thr Gly Gly Trp Val His Gly 
690 695 700 

Ala He Gin Thr Ala Cys Asn Ala Thr Cys Ala He He Tyr Gly Ser 
705 710 715 720 

Gly His Leu Gin Glu Leu He His Trp Arg His Leu Lys Glu Gly Asn 



725 



730 



735 
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Pro Leu Ala His Ala Trp Lys Arg Tyr Arg Tyr Gin Ala 
740 745 



<210> 29 
<211> 1401 
<212> DNA 

<213> Agrobacterium rhizogenes 

<220> 

<221> CDS 

<222> (1) . . (1398) 

<223> coding for indole acetamide hydrolase 
<400> 29 

atg gtg acc etc tec teg ate ace gag acg ctt aaa tgt etc agg gaa 48 
Met Val Thr Leu Ser Ser He Thr Glu Thr Leu Lys Cys Leu Arg Glu 
15 10 15 

aga aaa tac teg tgc ttt gag tta ate gaa acg ata ata gee cgc tgt 96 
Arg Lys Tyr Ser Cys Phe Glu Leu He Glu Thr He He Ala Arg Cys 
20 25 30 

gaa gca gca aga tec tta aac gee ttt ctg gaa acc gac tgg gcg cac 144 
Glu Ala Ala Arg Ser Leu Asn Ala Phe Leu Glu Thr Asp Trp Ala His 
35 40 45 

eta egg tgg act gee age aaa ate gat caa cac gga ggt gee ggt gtt 192 
Leu Arg Trp Thr Ala Ser Lys He Asp Gin His Gly Gly Ala Gly Val 
50 55 60 

ggc eta get ggc gtt ccc eta tgc ttt aaa gcg aat att gcg aca ggc 240 
Gly Leu Ala Gly Val Pro Leu Cys Phe Lys Ala Asn He Ala Thr Gly 
65 70 75 80 

agg ttc gee gcg acc get ggt acg cca ggc tta cag aac cac aaa ccc 288 
Arg Phe Ala Ala Thr Ala Gly Thr Pro Gly Leu Gin Asn His Lys Pro 

85 90 95 

aag acg cct gee gga gtt gca cga caa ctt etc gcg get ggg gca ctg 33 6 
Lys Thr Pro Ala Gly Val Ala Arg Gin Leu Leu Ala Ala Gly Ala Leu 
100 105 110 

cct ggc get teg gga aac atg cac gaa ttg tct ttt ggg ate acg age 3 84 
Pro Gly Ala Ser Gly Asn Met His Glu Leu Ser Phe Gly He Thr Ser 
115 120 125 

aac aac ttc gee aca ggc gee gta cga aac ccg tgg aac cct agt etc 432 
Asn Asn Phe Ala Thr Gly Ala Val Arg Asn Pro Trp Asn Pro Ser Leu 
130 135 140 

ate cca ggg gga tea agt ggg ggt gtg gee gee gcg gtg gee ggc cga 480 
He Pro Gly Gly Ser Ser Gly Gly Val Ala Ala Ala Val Ala Gly Arg 
145 150 155 160 

ttg atg ctg ggc ggc gtc gga act gac acg gga gcg teg gtc cgt tta 528 
Leu Met Leu Gly Gly Val Gly Thr Asp Thr Gly Ala Ser Val Arg Leu 
165 170 175 

ccg gee gee ttg tgc ggc gtg gtg ggg ttt cgt cct acc gtg ggg cga 57 6 
Pro Ala Ala Leu Cys Gly Val Val Gly Phe Arg Pro Thr Val Gly Arg 
180 185 190 

tat cca acg gac gga ata gtt ccg gta age ccc acc egg gac acc cct 624 
Tyr Pro Thr Asp Gly He Val Pro Val Ser Pro Thr Arg Asp Thr Pro 
195 200 205 
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672 



720 



768 



816 



864 



912 



960 



1008 



ggc gtt ate gca cag aat gtt ccg gac gtg att ctt ctt gac ggt ate 
Gly Val He Ala Gin Asn Val Pro Asp Val He Leu Leu Asp Gly He 

210 215 220 

att tgc ggg aga ccg ccg gtt aat caa acg gtc cgc ctg aag ggg ctg 
He Cys Gly Arg Pro Pro Val Asn Gin Thr Val Arg Leu Lys Gly Leu 
225 ~ 230 235 240 

cgt ata ggc ttg cca acc get tac ttt tac aac gac ctg gag ccc gat 
Arg He Gly Leu Pro Thr Ala Tyr Phe Tyr Asn Asp Leu Glu Pro Asp 
245 250 255 

gtc gec tta gca gec gag acg att ate aga gtt ctg gca cgc aaa gat 
Val Ala Leu Ala Ala Glu Thr He He Arg Val Leu Ala Arg Lys Asp 
260 265 270 

gtt act ttt gtt gaa gca gat att cct gat tta gcg cat cac aat gaa 
Val Thr Phe Val Glu Ala Asp He Pro Asp Leu Ala His His Asn Glu 
275 280 285 

ggg gtc age ttt ccg act gee ate tac gaa ttt ccg ttg tec ctt gaa 
Gly Val Ser Phe Pro Thr Ala He Tyr Glu Phe Pro Leu Ser Leu Glu 

290 295 300 

cat tat att cag aac ttc gta gag ggt gtt tec ttt tct gag gtt gtc 
His Tyr He Gin Asn Phe Val Glu Gly Val Ser Phe Ser Glu Val Val 
305 310 315 320 

aga gcg att cgc agt ccg gat gtt gca agt att etc aat gca caa etc 
Arg Ala He Arg Ser Pro Asp Val Ala Ser He Leu Asn Ala Gin Leu 
325 330 335 

teg gat aat ctt att tec aaa age gag tat tgt ctg gcg cga cgt ttt 1056 
Ser Asp Asn Leu He Ser Lys Ser Glu Tyr Cys Leu Ala Arg Arg Phe 
340 345 350 

ttc aga ccg aga etc caa gcg gec tac cac agt tac ttc aag gcg cat 1104 
Phe Arg Pro Arg Leu Gin Ala Ala Tyr His Ser Tyr Phe Lys Ala His 

355 3 60 3 65 

cag eta gat gca att ctt ttc cca aca get ccg ttg aca gec aag cca 1152 
Gin Leu Asp Ala He Leu Phe Pro Thr Ala Pro Leu Thr Ala Lys Pro 

370 375 380 

att ggc cat gat eta teg gtg att cac aat ggc tea atg acc gat acc 1200 
He Gly His Asp Leu Ser Val He His Asn Gly Ser Met Thr Asp Thr 
385 390 395 400 

ttt aaa ate ttc gtg egg aat gta gat ccc age agt aat gcg ggc ctg 1248 
Phe Lys He Phe Val Arg Asn Val Asp Pro Ser Ser Asn Ala Gly Leu 
405 410 415 

ccg ggc eta agt ctt ccc gtt tct ctt agt tec aac ggt ctg cct att 1296 
Pro Gly Leu Ser Leu Pro Val Ser Leu Ser Ser Asn Gly Leu Pro He 
420 425 430 

ggc atg gaa ate gat ggc tct gca age teg gat gaa cgt ctg tta gca 1344 
Gly Met Glu He Asp Gly Ser Ala Ser Ser Asp Glu Arg Leu Leu Ala 

435 440 445 

att gga eta gcg ata gaa gaa gca ata gac ttt agg cat cgt ccg act 1392 
He Gly Leu Ala He Glu Glu Ala He Asp Phe Arg His Arg Pro Thr 
450 455 460 

ctg teg taa 1401 

Leu Ser 

465 
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<210> 30 
<211> 466 
<212> PRT 

<213> Agrobacterium rhizogenes 
<400> 30 

Met Val Thr Leu Ser Ser lie Thr Glu Thr Leu Lys Cys Leu Arg Glu 

15 10 15 

Arg Lys Tyr Ser Cys Phe Glu Leu lie Glu Thr lie He Ala Arg Cys 

20 25 30 

Glu Ala Ala Arg Ser Leu Asn Ala Phe Leu Glu Thr Asp Trp Ala His 

35 40 45 

Leu Arg Trp Thr Ala Ser Lys He Asp Gin His Gly Gly Ala Gly Val 

50 55 60 

Glv Leu Ala Gly Val Pro Leu Cys Phe Lys Ala Asn He Ala Thr Gly 
65 70 75 80 

Arg Phe Ala Ala Thr Ala Gly Thr Pro Gly Leu Gin Asn His Lys Pro 

85 90 95 

Lys Thr Pro Ala Gly Val Ala Arg Gin Leu Leu Ala Ala Gly Ala Leu 

100 105 110 

Pro Gly Ala Ser Gly Asn Met His Glu Leu Ser Phe Gly He Thr Ser 

115 120 ... 125 

Asn Asn Phe Ala Thr Gly Ala Val Arg Asn Pro Trp Asn Pro Ser Leu 

130 135 ' 140 

He Pro Gly Gly Ser Ser Gly Gly Val Ala Ala Ala Val Ala Gly Arg 
145 ' 150 155 160 

Leu Met Leu Gly Gly Val Gly Thr Asp Thr Gly Ala Ser Val Arg Leu 
165 170 175 

Pro Ala Ala Leu Cys Gly Val Val Gly Phe Arg Pro Thr Val Gly Arg 

180 185 190 

Tyr Pro Thr Asp Gly He Val Pro Val Ser Pro Thr Arg Asp Thr Pro 
195 " 200 205 

Gly Val He Ala Gin Asn Val Pro Asp Val He Leu Leu Asp Gly He 

210 215 220 

He Cys Gly Arg Pro Pro Val Asn Gin Thr Val Arg Leu Lys Gly Leu 
225 230 235 240 

Arg He Gly Leu Pro Thr Ala Tyr Phe Tyr Asn Asp Leu Glu Pro Asp 

245 250 255 

Val Ala Leu Ala Ala Glu Thr He He Arg Val Leu Ala Arg Lys Asp 

260 265 270 

Val Thr Phe Val Glu Ala Asp He Pro Asp Leu Ala His His Asn Glu 

275 280 285 

Gly Val Ser Phe Pro Thr Ala He Tyr Glu Phe Pro Leu Ser Leu Glu 

290 295 300 

His Tyr He Gin Asn Phe Val Glu Gly Val Ser Phe Ser Glu Val Val 
305 310 315 320 

Arg Ala He Arg Ser Pro Asp Val Ala Ser He Leu Asn Ala Gin Leu 

325 330 335 

Ser Asp Asn Leu He Ser Lys Ser Glu Tyr Cys Leu Ala Arg Arg Phe 
340 345 350 
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Phe Arg Pro Arg Leu Gin Ala Ala Tyr His Ser Tyr Phe Lys Ala His 
355 360 365 

Gin Leu Asp Ala lie Leu Phe Pro Thr Ala Pro Leu Thr Ala Lys Pro 
370 375 380 

lie Gly His Asp Leu Ser Val lie His Asn Gly Ser Met Thr Asp Thr 
385 390 395 400 

Phe Lys lie Phe Val Arg Asn Val Asp Pro Ser Ser Asn Ala Gly Leu 
405 410 415 

Pro Gly Leu Ser Leu Pro Val Ser Leu Ser Ser Asn Gly Leu Pro lie 
420 425 430 

Gly Met Glu lie Asp Gly Ser Ala Ser Ser Asp Glu Arg Leu Leu Ala 
435 440 445 

lie Gly Leu Ala lie Glu Glu Ala He Asp Phe Arg His Arg Pro Thr 
450 . 455 460 

Leu Ser 
465 



<210> 31 
<211> 2268 
<212> DNA 

<213> Agrobacterium tumefaciens 

<220> 

<221> CDS 

<222> (1) . . (2265) 

<223> coding for tryptophan monooxygenase 
<400> 31 

atg tea get tea cct etc ctt gat aac cag tgc gat cat ttc tct acc 48 
Met Ser Ala Ser Pro Leu Leu Asp Asn Gin Cys Asp His Phe Ser Thr 
15 10 15 

aaa atg gtg gat ctg ata atg gtc gat aag get gat gaa ttg gac cgc 96 
Lys Met Val Asp Leu He Met Val Asp Lys Ala Asp Glu Leu Asp Arg 
20 25 30 

agg gtt tec gat gee ttc tea gaa cgt gaa get tct agg gga agg agg 144 
Arg Val Ser Asp Ala Phe Ser Glu Arg Glu Ala Ser Arg Gly Arg Arg 
35 40 45 

att act caa ate tec ggc gag tgc age get ggg tta get tgc aaa agg 192 
He Thr Gin He Ser Gly Glu Cys Ser Ala Gly Leu Ala Cys Lys Arg 
50 55 60 

ctg gee gac ggt cgc ttt ccc gag ate tea act ggt gag aag gta gca 240 
Leu Ala Asp Gly Arg Phe Pro Glu He Ser Thr Gly Glu Lys Val Ala 
65 70 75 80 

gec etc tec get tac ate tat gtt ggc aag gaa att ctg ggg egg ata 288 
Ala Leu Ser Ala Tyr He Tyr Val Gly Lys Glu He Leu Gly Arg He 

85 90 95 

ctt gaa teg gaa cct tgg gcg cga gca aga gtg agt ggt etc gtt gee 33 6 
Leu Glu Ser Glu Pro Trp Ala Arg Ala Arg Val Ser Gly Leu Val Ala 
100 105 110 

ate gac ctt gca cca ttt tgt atg gat ttc tec gaa gca caa ctt etc 384 
He Asp Leu Ala Pro Phe Cys Met Asp Phe Ser Glu Ala Gin Leu Leu 
115 120 125 
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caa acc ctg ttt ttg ctg age ggt aaa aga tgt gca tec age gat ctt 432 
Gin Thr Leu Phe Leu Leu Ser Gly Lys Arg Cys Ala Ser Ser Asp Leu 

130 135 140 

agt cat ttc gtg gec att tea ate tct aag act gee cgc tec cga acc 480 
Ser His Phe Val Ala lie Ser lie Ser Lys Thr Ala Arg Ser Arg Thr 
145 150 155 160 

ctg caa atg ccg ccg tac gag aaa ggc acg acg aaa cgc gtt acc ggg 528 
Leu Gin Met Pro Pro Tyr Glu Lys Gly Thr Thr Lys Arg Val Thr Gly 
165 170 175 

ttt acc ctg acc ctt gaa gag gee gta cca ttt gac atg gta get tat 576 
Phe Thr Leu Thr Leu Glu Glu Ala Val Pro Phe Asp Met Val Ala Tyr 
180 185 190 

ggt cga aac ctg atg ctg aag get teg gca ggt tec ttt cca aca att 624 
Gly Arg Asn Leu Met Leu Lys Ala Ser Ala Gly Ser Phe Pro Thr He 
195 200 205 

gac ttg etc tat gac tac aga teg ttt ttt gac caa tgt tec gat att 
Asp Leu Leu Tyr Asp Tyr Arg Ser Phe Phe Asp Gin Cys Ser Asp He 

210 215 220 

gga egg ate ggc ttc ttt ccg gaa gat gtt cct aag ccg aaa gtg gcg 
Gly Arg He Gly Phe Phe Pro Glu Asp Val Pro Lys Pro Lys Val Ala 
225 ' 230 235 240 

ate att ggc get ggc att tec gga etc gtg gta gca age gaa ctg ctt 
He He Gly Ala Gly He Ser Gly Leu Val Val Ala Ser Glu Leu Leu 
245 250 255 

cat get ggt gta gac gat gtt aca ata tat gaa gca agt gat egg gtt 
His Ala Gly Val Asp Asp Val Thr He Tyr Glu Ala Ser Asp Arg Val 
260 265 270 

gga ggc aag ctt tgg tea cat get ttc aag gat get ccc age gtg gtg 
Gly Gly Lys Leu Trp Ser His Ala Phe Lys Asp Ala Pro Ser Val Val 

275 280 285 

gee gaa atg ggg gcg atg cga ttt cct cct get gca teg tgc ttg ttt 
Ala Glu Met Gly Ala Met Arg Phe Pro Pro Ala Ala Ser Cys Leu Phe 

290 295 300 

ttc ttc etc gag egg tac ggc ctg tct teg atg agg ccg ttc cca aat 
Phe Phe , Leu Glu Arg Tyr Gly Leu Ser Ser Met Arg Pro Phe Pro Asn 
305 310 315 320 

ccc ggc aca gtc gac act aac ttg gtc tac caa ggc etc cga tac gtg 
Pro Gly Thr Val Asp Thr Asn Leu Val Tyr Gin Gly Leu Arg Tyr Val 
325 330 335 

tgg aaa gee ggg cag cag cca ccg aag ctg ttc cat cgc gtt tac age 
Trp Lys Ala Gly Gin Gin Pro Pro Lys Leu Phe His Arg Val Tyr Ser 
340 345 350 

ggt tgg cgt gcg ttc ttg agg gac ggt ttc cat gag gga gat att gtg 1104 

Gly Trp Arg Ala Phe Leu Arg Asp Gly Phe His Glu Gly Asp He Val 

355 360 365 

ttg get teg cct gtt gtt att act caa gee ttg aaa tea gga gac att 1152 

Leu Ala Ser Pro Val Val He Thr Gin Ala Leu Lys * Ser Gly Asp He 

370 375 380 



672 



720 



768 



816 



864 



912 



960 



1008 



1056 



agg egg get cat gac tec tgg caa act tgg ctg aac cgt ttc ggg agg 
Arg Arg Ala His Asp Ser Trp Gin Thr Trp Leu Asn Arg Phe Gly Arg 
385 390 395 400 
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1248 



1296 



1344 



1392 



1440 



1488 



gag tec ttc tct tea gcg ata gag agg ate ttt ctg ggc acg cat cct 
Glu Ser Phe Ser Ser Ala lie Glu Arg lie Phe Leu Gly Thr His Pro 
405 410 415 

cct ggt ggt gaa aca tgg agt ttc cct cat gat tgg gac eta ttc aag 
Pro Gly Gly Glu Thr Trp Ser Phe Pro His Asp Trp Asp Leu Phe Lys 
420 425 430 

eta atg gga ata gga tct ggc ggg ttt ggt cca gtt ttt gaa age ggg 
Leu Met Gly He Gly Ser Gly Gly Phe Gly Pro Val Phe Glu Ser Gly 
435 440 445 

ttt att gag ate ctt cgc ttg gtc ata aac gga tat gaa gaa aat cag 
Phe He Glu lie Leu Arg Leu Val lie Asn Gly Tyr Glu Glu Asn Gin 
450 455 460 

egg atg tgc tct gaa gga ate tea gaa ctt cca cgt cga ata gee tct 
Arg Met Cys Ser Glu Gly He Ser Glu Leu Pro Arg Arg He Ala Ser 
465 "* 470 475 480 

caa gtg gtt aac ggt gtg tct gta age cag cgt ata cgc cat gtt caa 
Gin Val Val Asn Gly Val Ser Val Ser Gin Arg He Arg His Val Gin 
485 490 495 

gtc agg gcg att gag aag gaa aag aca aaa ata aag ata agg ctt aag 153 6 
Val Arg Ala He Glu Lys Glu Lys Thr Lys He Lys He Arg Leu Lys 
500 505 510 

age ggg ata tct gaa ctt tat gat aag gtg gtg gtt aca tct gga etc 1584 
Ser Gly He Ser Glu Leu Tyr Asp Lys Val Val Val Thr Ser Gly Leu 
515 520 525 

gca aat ate caa etc agg cat tgt ctg aca tgc gat ace ace att ttt 1632 
Ala Asn He Gin Leu Arg His Cys Leu Thr Cys Asp Thr Thr He Phe 
530 535 540 

cgt gca cca gtg aac caa gcg gtt gat aac age cat atg aca ggc teg 1680 
Arg Ala Pro Val Asn Gin Ala Val Asp Asn Ser His Met Thr Gly Ser 
545 550 555 560 

tea aaa etc ttt ctg ctg act gaa cga aaa ttt tgg tta gac cat ate 1728 
Ser Lys Leu Phe Leu Leu Thr Glu Arg Lys Phe Trp Leu Asp His He 
565 570 575 

etc ccg tec tgt gtc etc atg gac ggg ate gca aaa gca gtg tac tgc 1776 
Leu Pro Ser Cys Val Leu Met Asp Gly He Ala Lys Ala Val Tyr Cys 
580 585 590 

ttg gac tat gag ccg cag gat ccg aat ggt aaa ggt ctg gtg ccc ccc 1824 
Leu Asp Tyr Glu Pro Gin Asp Pro Asn Gly Lys Gly Leu Val Pro Pro 
595 600 605 

act tat aca tgg gag gac gac tec cac aag ctg ttg gcg gtt ccc gac 1872 
Thr Tyr Thr Trp Glu Asp Asp Ser His Lys Leu Leu Ala Val Pro Asp 
610 615 620 

aaa aaa gag cga ttc tgt ctg ctg egg gac gca att teg aga tct ttc 1920 
Lys Lys Glu Arg Phe Cys Leu Leu Arg Asp Ala He Ser Arg Ser Phe 
625 630 635 640 

ccg gcg ttt gee cag cat eta gtt cct gee tgc get gat tac gac caa 1968 
Pro Ala Phe Ala Gin His Leu Val Pro Ala Cys Ala Asp Tyr Asp Gin 
645 650 655 

aat gtt gtt caa cat gat tgg ctt aca gac gag aat gee ggg gga get 2016 
Asn Val Val Gin His Asp Trp Leu Thr Asp Glu Asn Ala Gly Gly Ala 
660 665 670 
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.ttc aaa etc aac egg cgt ggc gag gat ttt tat tot gaa gaa ctt ttc 
Phe Lys Leu Asn Arg Arg Gly Glu Asp Phe Tyr Ser Glu Glu Leu Phe 
6 75 680 685 

ttt caa gcg ctg gac atg cct aat gat acc gga gtt tac ttg gcg ggt 
Phe Gin Ala Leu Asp Met Pro Asn Asp Thr Gly Val Tyr Leu Ala Gly 

690 695 700 

tgc agt tgt tec ttc acc ggt gga tgg gtg gag ggc get att cag acc 
Cys Ser Cys Ser Phe Thr Gly Gly Trp Val Glu Gly Ala He Gin Thr 
705 710 715 720 

gcg tgt aac gee gtc tgt gca att ate cac aat tgt gga ggt att ttg 
Ala Cys Asn Ala Val Cys Ala He He His Asn Cys Gly Gly He Leu 

725 730 735 

gca aag gac aat cct etc gaa cac tct tgg aag aga tat aac tac cgc 2256 
Ala Lys Asp Asn Pro Leu Glu His Ser Trp Lys Arg Tyr Asn Tyr Arg 

745 750 




740 

aat aga aat taa 
Asn Arg Asn 
755 

<210> 32 
<211> 755 
<212> PRT 

<213> Agrobacterium tumefaciens 




2064 



2112 



2160 



2208 



Met°Ser 2 Ala Ser Pro Leu Leu Asp Asn Gin Cys Asp His Phe Ser Thr 

15 10 15 

Lys Met Val Asp Leu He Met Val Asp Lys Ala Asp Glu Leu Asp Arg 

20 25 30 

Arg Val Ser Asp Ala Phe Ser Glu Arg Glu Ala Ser Arg Gly Arg Arg 

35 40 45 

He Thr Gin He Ser Gly Glu Cys Ser Ala Gly Leu Ala Cys Lys Arg 

50 55 60 

Leu Ala Asp Gly Arg Phe Pro Glu He Ser Thr Gly Glu Lys Val Ala 
65 ~ 70 75 80 

Ala Leu Ser Ala Tyr He Tyr Val Gly Lys Glu He Leu Gly Arg He 

85 90 95 

Leu Glu Ser Glu Pro Trp Ala Arg Ala Arg Val Ser Gly Leu Val Ala 

100 105 11° 

He Asp Leu Ala Pro Phe Cys Met Asp Phe Ser Glu Ala Gin Leu Leu 

115 120 125 

Gin Thr Leu Phe Leu Leu Ser Gly Lys Arg Cys Ala Ser Ser Asp Leu 

130 135 14° 

Ser His Phe Val Ala He Ser He Ser Lys Thr Ala Arg Ser Arg Thr 
145 150 155 160 

Leu Gin Met Pro Pro Tyr Glu Lys Gly Thr Thr Lys Arg Val Thr Gly 

165 170 175 

Phe Thr Leu Thr Leu Glu Glu Ala Val Pro Phe Asp Met Val Ala Tyr 
180 185 190 

Gly Arg Asn Leu Met Leu Lys Ala Ser Ala Gly Ser Phe Pro Thr He 
195 200 205 



2268 
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Asp Leu Leu Tyr Asp Tyr Arg Ser Phe Phe Asp Gin Cys Ser Asp lie 
210 215 220 

Gly Arg lie Gly Phe Phe Pro Glu Asp Val Pro Lys Pro Lys Val Ala 
225 230 235 240 

lie lie Gly Ala Gly lie Ser Gly Leu Val Val Ala Ser Glu Leu Leu 
245 250 255 

His Ala Gly Val Asp Asp Val Thr lie Tyr Glu Ala Ser Asp Arg Val 
260 265 270 

Gly Gly Lys Leu Trp Ser His Ala Phe Lys Asp Ala Pro Ser Val Val 
275 280 285 

Ala Glu Met Gly Ala Met Arg Phe Pro Pro Ala Ala Ser Cys Leu Phe 
290 295 300 

Phe Phe Leu Glu Arg Tyr Gly Leu Ser Ser Met Arg Pro Phe Pro Asn 
305 310 315 320 

Pro Gly Thr Val Asp Thr Asn Leu Val Tyr Gin Gly Leu Arg Tyr Val 
325 330 335 

Trp Lys Ala Gly Gin Gin Pro Pro Lys Leu Phe His Arg Val Tyr Ser 
340 345 350 

Gly Trp Arg Ala Phe Leu Arg Asp Gly Phe His Glu Gly Asp lie Val 
355 360 365 

Leu Ala Ser Pro Val Val lie Thr Gin Ala Leu Lys Ser Gly Asp lie 
370 375 380 

Arg Arg Ala His Asp Ser Trp Gin Thr Trp Leu Asn Arg Phe Gly Arg 
385 390 395 400 

Glu Ser Phe Ser Ser Ala lie Glu Arg lie Phe Leu Gly Thr His Pro 
405 410 415 

Pro Gly Gly Glu Thr Trp Ser Phe Pro His Asp Trp Asp Leu Phe Lys 
420 425 430 

Leu Met Gly He Gly Ser Gly Gly Phe Gly Pro Val Phe Glu Ser Gly 
435 440 445 

Phe He Glu He Leu Arg Leu Val He Asn Gly Tyr Glu Glu Asn Gin 
450 455 460 

Arg Met Cys Ser Glu Gly He Ser Glu Leu Pro Arg Arg He Ala Ser 
465 470 475 480 

Gin Val Val Asn Gly Val Ser Val Ser Gin Arg He Arg His Val Gin 
485 490 495 

Val Arg Ala He Glu Lys Glu Lys Thr Lys He Lys He Arg Leu Lys 
500 505 510 

Ser Gly He Ser Glu Leu Tyr Asp Lys Val Val Val Thr Ser Gly Leu 
515 520 525 

Ala Asn He Gin Leu Arg His Cys Leu Thr Cys Asp Thr Thr He Phe 
530 535 540 

Arg Ala Pro Val Asn Gin Ala Val Asp Asn Ser His Met Thr Gly Ser 
545 550 555 560 

Ser Lys Leu Phe Leu Leu Thr Glu Arg Lys Phe Trp Leu Asp His He 
565 570 575 

Leu Pro Ser Cys Val Leu Met Asp Gly He Ala Lys Ala Val Tyr Cys 
580 585 590 
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Leu Asp Tyr Glu Pro Gin Asp Pro Asn Gly Lys Gly Leu Val Pro Pro 
595 600 605 

Thr Tyr Thr Trp Glu Asp Asp Ser His Lys Leu Leu Ala Val Pro Asp 
610 615 620 

Lys Lys Glu Arg Phe Cys Leu Leu Arg Asp Ala lie Ser Arg Ser Phe 
625 630 635 640 

Pro Ala Phe Ala Gin His Leu Val Pro Ala Cys Ala Asp Tyr Asp Gin 
645 650 655 

Asn Val Val Gin His Asp Trp Leu Thr Asp Glu Asn Ala Gly Gly Ala 
660 665 670 

Phe Lys Leu Asn Arg Arg Gly Glu Asp Phe Tyr Ser Glu Glu Leu Phe 
675 680 685 

Phe Gin Ala Leu Asp Met Pro Asn Asp Thr Gly Val Tyr Leu Ala Gly 
690 695 700 

Cys Ser Cys Ser Phe Thr Gly Gly Trp Val Glu Gly Ala lie Gin Thr 
705 ~ 710 715 720 

Ala Cys Asn Ala Val Cys Ala lie lie His Asn Cys Gly Gly lie Leu 
725 730 735 

Ala Lys Asp Asn Pro Leu Glu His Ser Trp Lys Arg Tyr Asn Tyr Arg 
740 745 750 

i\ 

Asn Arg Asn 
755 



<210> 33 
<211> 1404 
<212> DNA 

<213> Agrobacterium tumefaciens 

<220> 

<221> CDS 

<222> (1) . . (1401) 

<223> coding for indole acetamide hydrolase 
<400> 33 

atg gtg ccc att acc teg tta gca caa acc eta gaa cgc ctg aga egg 48 
Met Val Pro He Thr Ser Leu Ala Gin Thr Leu Glu Arg Leu Arg Arg 
15 10 15 

aaa gac tac tec tgc tta gaa eta gta gaa act ctg ata gcg cgt tgc 96 
Lys Asp Tyr Ser Cys Leu Glu Leu Val Glu Thr Leu He Ala Arg Cys 
20 25 30 

caa get gca aaa cca tta aat gee ctt ctg get aca gac tgg gat ggc 144 
Gin Ala Ala Lys Pro Leu Asn Ala Leu Leu Ala Thr Asp Trp Asp Gly 
35 40 45 

ttg egg cga age gee aaa aaa aat gat cgt cat gga aac gec gga tta 192 
Leu Arg Arg Ser Ala Lys Lys Asn Asp Arg His Gly Asn Ala Gly Leu 
50 55 60 

ggt ctt tgc ggc att cca etc tgt ttt aag gcg aac ate gcg acc ggc 240 
Gly Leu Cys Gly He Pro Leu Cys Phe Lys Ala Asn He Ala Thr Gly 
65 70 75 80 

gta ttt cct aca age get get act ccg gcg ctg ata aac cac ttg cca 288 
Val Phe Pro Thr Ser Ala Ala Thr Pro Ala Leu He Asn His Leu Pro 

85 90 95 
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aag ata cca tec cgc gtc gca gaa aga ctt ttt tea get gga gca ctg 336 

Lys lie Pro Ser Arg Val Ala Glu Arg Leu Phe Ser Ala Gly Ala Leu 
100 105 110 

ccg ggt gec teg gga aac atg cat gag tta teg ttt gga att acg age 3 84 
Pro Gly Ala Ser Gly Asn Met His Glu Leu Ser Phe Gly He Thr Ser 

115 120 125 

aac aac tat gee acc ggt gcg gtg egg aac ccg tgg aat cca agt ctg 432 
Asn Asn Tyr Ala Thr Gly Ala Val Arg Asn Pro Trp Asn Pro Ser Leu 

130 135 140 

ata cca ggg ggt tea age ggt ggt gtg get get gcg gtg gca age cga 480 
He Pro Gly Gly Ser Ser Gly Gly Val Ala Ala Ala Val Ala Ser Arg 
145 150 155 160 

ttg atg tta ggc ggc ata ggc acg gat acc ggt gca tct gtt cgc eta 528 
Leu Met Leu Gly Gly He Gly Thr Asp Thr Gly Ala Ser Val Arg Leu 
165 170 175 

ccg gca gee ctg tgt ggc gta gta gga ttt cga ccg acg ctt ggt cga 576 
Pro Ala Ala Leu Cys Gly Val Val Gly Phe Arg Pro Thr Leu Gly Arg 
180 185 190 

tat cca aga gat egg ata ata ccg ttc age ccc acc egg gac acc gee 624 
Tyr Pro Arg Asp Arg He He Pro Phe Ser Pro Thr Arg Asp Thr Ala 

195 200 205 

gga ate ata gcg cag tgc gta gee gat gtt ata ate etc gac cag gtg 672 
Gly He He Ala Gin Cys Val Ala Asp Val He He Leu Asp Gin Val 

210 215 220 

att tec gga egg teg gcg aaa att tea ccc atg ccg ctg aag ggg ctt 720 
He Ser Gly Arg Ser Ala Lys He Ser Pro Met Pro Leu Lys Gly Leu 
225 ~ 230 235 240 

egg ate ggc etc ccc act acc tac ttt tac gat gac ctt gat get gat 7 68 
Arg He Gly Leu Pro Thr Thr Tyr Phe Tyr Asp Asp Leu Asp Ala Asp 
245 250 255 

gtg gee ttc gca get gaa acg acg att cgc ttg eta gee aac aga ggc 816 
Val Ala Phe Ala Ala Glu Thr Thr He Arg Leu Leu Ala Asn Arg Gly 
260 265 270 

gta acc ttt gtt gaa gee gac ate ccc cac eta gag gaa ttg aac agt 864 
Val Thr Phe Val Glu Ala Asp He Pro His Leu Glu Glu Leu Asn Ser 

275 280 285 

ggg gca agt ttg cca att gcg ctt tac gaa ttt cca cac get eta aaa 912 
Gly Ala Ser Leu Pro He Ala Leu Tyr Glu Phe Pro His Ala Leu Lys 

290 295 300 

aag tat etc gac gat ttt gtg gga aca gtt tct ttt tct gac gtt ate 960 
Lys Tyr Leu Asp Asp Phe Val Gly Thr Val Ser Phe Ser Asp Val He 
305 310 315 320 

aaa gga att cgt age ccc gat gta gcg aac att gtc agt gcg caa att 
Lys Gly He Arg Ser Pro Asp Val Ala Asn He Val Ser Ala Gin He 
325 330 335 

gat ggg cat caa att tec aac gat gaa tat gaa ctg gcg cgt caa tec 1056 
Asp Gly His Gin He Ser Asn Asp Glu Tyr Glu Leu Ala Arg Gin Ser 
340 345 350 

ttc agg cca agg etc cag gee act tat egg aat tac ttc aga etc tat 1104 
Phe Arg Pro Arg Leu Gin Ala Thr Tyr Arg Asn Tyr Phe Arg Leu Tyr 
355 360 365 
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get ttt aat tag 
Ala Phe Asn 
465 

<210> 34 
<211> 467 
<212> PRT 

<213> Agrobacterium tumefaciens 
<400> 34 

Met Val Pro lie Thr Ser Leu Ala Gin Thr Leu Glu Arg Leu Arg Arg 
15 10 15 

Lys Asp Tyr Ser Cys Leu Glu Leu Val Glu Thr Leu lie Ala Arg Cys 
20 25 30 

Gin Ala Ala Lys Pro Leu Asn Ala Leu Leu Ala Thr Asp Trp Asp Gly 
35 40 45 

Leu Arg Arg Ser Ala Lys Lys Asn Asp Arg His Gly Asn Ala Gly Leu 

50 55 60 

Gly Leu- Cys Gly lie Pro Leu Cys Phe Lys Ala Asn He Ala Thr Gly 

65 ' 70 75 80 

Val Phe Pro Thr Ser Ala Ala Thr Pro Ala Leu He Asn His Leu Pro 

85 90 95 

Lys He Pro Ser Arg Val Ala Glu Arg Leu Phe Ser Ala Gly Ala Leu 
100 105 110 

Pro Gly Ala Ser Gly Asn Met His Glu Leu Ser Phe Gly He Thr Ser 
115 120 125 

Asn Asn Tyr Ala Thr Gly Ala Val Arg Asn Pro Trp Asn Pro Ser Leu 

130 135 140 

He Pro Gly Gly Ser Ser Gly Gly Val Ala Ala Ala Val Ala Ser Arg 
145 150 155 160 

Leu Met Leu Gly Gly He Gly Thr Asp Thr Gly Ala Ser Val Arg Leu 
165 170 175 

Pro Ala Ala Leu Cys Gly Val Val Gly Phe Arg Pro Thr Leu Gly Arg 
180 185 190 



1152 



1200 



cag tta gat gca ate ctt ttc cca act gca ccc tta gcg gec aaa gec 
Gin Leu Asp Ala He Leu Phe Pro Thr Ala Pro Leu Ala Ala Lys Ala 

370 375 380 

ata ggt cag gag teg tea gtc ate cac aat ggc tea atg atg aac act 
He Gly Gin Glu Ser Ser Val He His Asn Gly Ser Met Met Asn Thr 
385 ~ 390 395 400 

ttc aag ate tac gtg cga aat gtg gac cca age age aac gca ggc eta 1248 
Phe Lys He Tyr Val Arg Asn Val Asp Pro Ser Ser Asn Ala Gly Leu 
405 410 415 

cct ggg ttg age ctt cct gee tgc ctt aca cct gat cgc ttg cct gtt 1296 
Pro Gly Leu Ser Leu Pro Ala Cys Leu Thr Pro Asp Arg Leu Pro Val 
420 425 430 

gga atg gaa att gat gga tta gcg ggg tea gac cac cgt ctg tta gca 1344 
Gly Met Glu He Asp Gly Leu Ala Gly Ser Asp His Arg Leu Leu Ala 

435 440 445 

ate ggg gca gca tta gaa aaa get ata aat ttt tct tec ttt ccc gat 
He Gly Ala Ala Leu Glu Lys Ala He Asn Phe Ser Ser Phe Pro Asp 
450 455 460 



1392 



1404 
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Tyr Pro Arg Asp Arg lie He Pro Phe Ser Pro Thr Arg Asp Thr Ala 

195 ~ 200 205 

Gly He He Ala Gin Cys Val Ala Asp Val He He Leu Asp Gin Val 

210 215 220 

He Ser Gly Arg Ser Ala Lys He Ser Pro Met Pro Leu Lys Gly Leu 
225 ~ " 230 235 240 

Arg He Gly Leu Pro Thr Thr Tyr Phe Tyr Asp Asp Leu Asp Ala Asp 
245 250 255 

Val Ala Phe Ala Ala Glu Thr Thr He Arg Leu Leu Ala Asn Arg Gly 
260 265 270 

Val Thr Phe Val Glu Ala Asp He Pro His Leu Glu Glu Leu Asn Ser 

275 280 285 

Gly Ala Ser Leu Pro He Ala Leu Tyr Glu Phe Pro His Ala Leu Lys 

290 295 300 

Lys Tyr Leu Asp Asp Phe Val Gly Thr Val Ser Phe Ser Asp Val He 
305 ~ 310 315 320 

Lvs Gly He Arg Ser Pro Asp Val Ala Asn He Val Ser Ala Gin He 
325 330 335 

Asp Gly His Gin He Ser Asn Asp Glu Tyr Glu Leu Ala Arg Gin Ser 
340 345 350 

Phe Arg Pro Arg Leu Gin Ala Thr Tyr Arg Asn Tyr Phe Arg Leu Tyr 
355 360 365 

Gin Leu Asp Ala He Leu Phe Pro Thr Ala Pro Leu Ala Ala Lys Ala 

370 375 380 

He Gly Gin Glu Ser Ser Val He His Asn Gly Ser Met Met Asn Thr 
385 390 395 400 

Phe Lys He Tyr Val Arg Asn Val Asp Pro Ser Ser Asn Ala Gly Leu 
405 410 415 

Pro Gly Leu Ser Leu Pro Ala Cys Leu Thr Pro Asp Arg Leu Pro Val 
420 425 430 

Gly Met Glu He Asp Gly Leu Ala Gly Ser Asp His Arg Leu Leu Ala 

435 440 445 

He Gly Ala Ala Leu Glu Lys Ala He Asn Phe Ser Ser Phe Pro Asp 
450 455 460 

Ala Phe Asn 
465 



<210> 35 
<211> 1419 
<212> DNA 

<213> Agrobacterium vitis 

<220> 

<221> CDS 

<222> (1) . . (1416) 

<223> coding for indole acetamide hydrolase 
<400> 35 

atg gtg acc eta ggt tea ate aag gaa acc ctg gaa tgt etc agg ctg 
Met Val Thr Leu Gly Ser He Lys Glu Thr Leu Glu Cys Leu Arg Leu 
15 10 15 
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aaa aaa tac tec tgt tec gaa ctg get gaa ace ata ata gec cgt tgc 96 

Lys Lys Tyr Ser Cys Ser Glu Leu Ala Glu Thr lie lie Ala Arg Cys 
20 25 30 

gaa gee gcg aaa tct etc aat get ctt ctg gcg act gac tgg gat tac 144 
Glu Ala Ala Lys Ser Leu Asn Ala Leu Leu Ala Thr Asp Trp Asp Tyr 
35 40 45 

ctg egg cgt aat gec aag aaa gta gat gaa gat gga age gec ggc gag 192 
Leu Arg Arg Asn Ala Lys Lys Val Asp Glu Asp Gly Ser Ala Gly Glu 
50 55 60 

ggt ctt gee ggc ate ccg ctg tgt tct aaa gcg aac att gca aca ggc 240 
Gly Leu Ala Gly lie Pro Leu Cys Ser Lys Ala Asn He Ala Thr Gly 
65 70 75 80 

ata ttc cca gca age gcg gee acg ccg gcg ctt gat gaa cat tta cct 2 88 
He Phe Pro Ala Ser Ala Ala Thr Pro Ala Leu Asp Glu His Leu Pro 

85 90 95 

aca aca cca gec ggc gtc cgt aaa ccg ctt eta gac get ggg gca ctg 33 6 
Thr Thr Pro Ala Gly Val Arg Lys Pro Leu Leu Asp Ala Gly Ala Leu 
100 105 110 

ata ggc get teg gga aac atg cat gag tta teg ttt ggc att ace agt 384 
He Gly Ala Ser Gly Asn Met His Glu Leu Ser Phe Gly He Thr Ser 
115 120 125 

aac aac cac gec act ggt gcg gtg aga aac ccc tgg aat ccc age tta 432 
Asn Asn His Ala Thr Gly Ala Val Arg Asn Pro Trp Asn Pro Ser Leu 
130 135 140 

ata cca gga ggc teg age ggc ggc gtg get get get gta gca tea egg 480 
He Pro Gly Gly Ser Ser Gly Gly Val Ala Ala Ala Val Ala Ser Arg 
145 150 155 160 

tta atg etc ggc gga att ggc ace gac acg ggg get teg gtc cgc eta 52 8 
Leu Met Leu Gly Gly He Gly Thr Asp Thr Gly Ala Ser Val Arg Leu 
165 170 175 

cct gca tec eta Jtgt ggc gta gtg gga ttc cgc ccg acg ate ggc aga 57 6 
Pro Ala Ser Leu Cys Gly Val Val Gly Phe Arg Pro Thr He Gly Arg 
180 185 190 

tat cct gga gac cga att gtg ccg gtt age ccc ace cgc gat aca gee 624 
Tyr Pro Gly Asp Arg He Val Pro Val Ser Pro Thr Arg Asp Thr Ala 
195 200 205 

gga att ate gca cag age gtt cct gat gtg ata etc ctt gac caa ate 672 
Gly He He Ala Gin Ser Val Pro Asp Val He Leu Leu Asp Gin He 
210 215 220 

att tgc ggg aag etc acg ace cac caa cct gta ccc ctg gag gga tta 720 
He Cys Gly Lys Leu Thr Thr His Gin Pro Val Pro Leu Glu Gly Leu 
225 230 235 " 240 

cgt ate ggc ttg cca ace act tac ttt tac gat gac ctt gat get gat 768 
Arg He Gly Leu Pro Thr Thr Tyr Phe Tyr Asp Asp Leu Asp Ala Asp 
245 250 " 255 

gtg gec ttc gca get gaa aac ctt ate acg ctg ctg gee age aag ggt 816 
Val Ala Phe Ala Ala Glu Asn Leu He Thr Leu Leu Ala Ser Lys Gly 
260 265 270 

gta acc ttt gtt aag gec gag att cca gat ctg cag cgt ctg aac ate 864 
Val Thr Phe Val Lys Ala Glu He Pro Asp Leu Gin Arg Leu Asn He 
275 280 285 



BASF Plant Science GmbH 



20020471 



PF 53790 DE 





52 

ggg gtt age ttt cct att gec ctg tac gag ttt ccg ttc gec eta caa 912 
Gly Val Ser Phe Pro lie Ala Leu Tyr Glu Phe Pro Phe Ala Leu Gin 
290 295 300 

aag tat ate gat gac ttt gtg aag gat gtg tct ttt tct gac gtc ate 960 
Lys Tyr lie Asp Asp Phe Val Lys Asp Val Ser Phe Ser Asp Val lie 
305 310 315 320 

aaa gga att cgt age cct gat gta gee aac att gee aat get caa att 1008 
Lys Gly lie Arg Ser Pro Asp Val Ala Asn lie Ala Asn Ala Gin lie 
325 330 335 

gat gga cat caa att tec aaa get tea tat gaa ctg gcg cga caa tct 1056 
Asp Gly His Gin lie Ser Lys Ala Ser Tyr Glu Leu Ala Arg Gin Ser 
340 345 350 

ttc aga cca aag ctg caa gec gee tac cat gat tac ttc aag ctg cac 1104 
Phe Arg Pro Lys Leu Gin Ala Ala Tyr His Asp Tyr Phe Lys Leu His 
355 360 365 

cag eta gac gcg ate ctt ttc ccg aca get ccc ctg aca gec aaa ccg 1152 
Gin Leu Asp Ala He Leu Phe -Pro Thr Ala Pro Leu Thr Ala Lys Pro 
370 • 375" 380 

ate ggc caa gat tta teg gtg atg cac aat ggc gta atg gec gac acg 1200 
He Gly Gin Asp Leu Ser Val Met His Asn Gly Val Met Ala Asp Thr 
385 390 395 400 

ttt aaa ate ttc gtg cga aat gtg gat ccg ggg age aac gca ggc ctg 1248 
Phe Lys He Phe Val Arg Asn Val Asp Pro Gly Ser Asn Ala Gly Leu 
405 410 415 

cca gga tta age ctt ccc gtt tct ctt act tea aag ggt ttg cct att 1296 
Pro Gly Leu Ser Leu Pro Val Ser Leu Thr Ser Lys Gly Leu Pro lie 
420 425 430 

gga atg gaa ate gat gga tta gcg ggc atg gac gac cgt ttg eta gca 1344 
Gly Met Glu He Asp Gly Leu Ala Gly Met Asp Asp Arg Leu Leu Ala 
435 440 445 

ate gga gcg gca eta gag gaa gcg ata get ttt cat aat tta cct gac 1392 
He Gly Ala Ala Leu Glu Glu Ala He Ala Phe His Asn Leu Pro Asp 
450 455 460 

ttc ccg aaa gtc gag aca aac tac tga 1419 
Phe Pro Lys Val. Glu Thr Asn Tyr 
465 470 

<210> 36 
<211> 472 
<212> PRT 

<213> Agrobacterium vitis 
<400> 36 

Met Val Thr Leu Gly Ser He Lys Glu Thr Leu Glu Cys Leu Arg Leu 

1 5 10 15 

Lys Lys Tyr Ser Cys Ser Glu Leu Ala Glu Thr He He Ala Arg Cys 
20 25 30 

Glu Ala Ala Lys Ser Leu Asn Ala Leu Leu Ala Thr Asp Trp Asp Tyr 
3 5 40 45 

Leu Arg Arg Asn Ala Lys Lys Val Asp Glu Asp Gly Ser Ala Gly Glu 
50 55 60 

Gly Leu Ala Gly He Pro Leu Cys Ser Lys Ala Asn He Ala Thr Gly 
65 70 75 80 
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He phe Pro Ala Ser Ala Ala Thr Pro Ala Leu Asp Glu His Leu Pro 

85 90 95 

Thr Thr Pro Ala Gly Val Arg Lys Pro Leu Leu Asp Ala Gly Ala Leu 
100 105 110 

He Gly Ala Ser Gly Asn Met His Glu Leu Ser Phe Gly He Thr Ser 
115 ~ 120 125 

Asn Asn His Ala Thr Gly Ala Val Arg Asn Pro Trp Asn Pro Ser Leu 

130 135 140 

He Pro Gly Gly Ser Ser Gly Gly Val Ala Ala Ala Val Ala Ser Arg 
145 * 150 155 160 

Leu Met Leu Gly Gly He Gly Thr Asp Thr Gly Ala Ser Val Arg Leu 
165 170 175 

Pro Ala Ser Leu Cys Gly Val Val Gly Phe Arg Pro Thr He Gly Arg 
180 185 190 

Tyr Pro Gly Asp Arg He Val Pro Val Ser Pro Thr Arg Asp Thr Ala 
195 200 205 

Gly He He Ala Gin Ser Val Pro Asp Val He Leu Leu Asp Gin He 
210 215 220 

He Cys Gly Lys Leu Thr Thr His Gin Pro Val Pro Leu Glu Gly Leu 
225 230 235 240 

Arg He Gly Leu Pro Thr Thr Tyr Phe Tyr Asp Asp Leu Asp Ala Asp 
245 250 255 

Val Ala Phe Ala Ala Glu Asn Leu He Thr Leu Leu Ala Ser Lys Gly 
260 265 270 

Val Thr Phe Val Lys Ala Glu He Pro Asp Leu Gin Arg Leu Asn He 
275 280 285 

Gly Val Ser Phe Pro He Ala Leu Tyr Glu Phe Pro Phe Ala Leu Gin 
290 295 300 

Lys Tyr He Asp Asp Phe Val Lys Asp Val Ser Phe Ser Asp Val He 
305 ~ 310 315 320 

Lys Gly He Arg Ser Pro Asp Val Ala Asn He Ala Asn Ala Gin He 
325 33 0 33 5 

Asp Gly His Gin He Ser Lys Ala Ser Tyr Glu Leu Ala Arg Gin Ser 
340 345 350 

Phe Arg Pro Lys Leu Gin Ala Ala Tyr His Asp Tyr Phe Lys Leu His 
355 360 365 

Gin Leu Asp Ala He Leu Phe Pro Thr Ala Pro Leu Thr Ala Lys Pro 
370 375 380 

He Gly Gin Asp Leu Ser Val Met His Asn Gly Val Met Ala Asp Thr 
385 390 395 400 

Phe Lys He Phe Val Arg Asn Val Asp Pro Gly Ser Asn Ala Gly Leu 
405 410 415 

Pro Gly Leu Ser Leu Pro Val Ser Leu Thr Ser Lys Gly Leu Pro He 
420 425 430 

Gly Met Glu He Asp Gly Leu Ala Gly Met Asp Asp Arg Leu Leu Ala 
435 440 445 

He Gly Ala Ala Leu Glu Glu Ala He Ala Phe His Asn Leu Pro Asp 
450 455 460 
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Phe Pro Lys Val Glu Thr Asn Tyr 
465 470 

<210> 37 
<211> 1263 
<212> DNA 

<213> Arabidopsis thaliana 

<220> 
<221> CDS 
<222> (1) . . (1260) 

<223> coding for 5-methylthioribose kinase 
<400> 37 

atg tct ttt gag gag ttt acg ccg tta aac gag aag tct ctt gta gac 48 
Met Ser Phe Glu Glu Phe Thr Pro Leu Asn Glu Lys Ser Leu Val Asp 
15 10 15 

tac ate aag tea aca cct get etc tct tec aag ate gga gee gac aag 96 
Tyr lie Lys Ser Thr Pro Ala Leu Ser Ser Lys He Gly Ala Asp Lys 
20 25 30 

tec gat gat gat ttg gtt ate aaa gaa gtt gga gat ggc aat etc aat 144 
Ser Asp Asp Asp Leu Val He Lys Glu Val Gly Asp Gly Asn Leu Asn 
35 40 45 

ttc gtt ttc ate gtt gtt gga tec tct ggt tct ctt gtc ate aaa cag 192 
Phe Val Phe He Val Val Gly Ser Ser Gly Ser Leu Val He Lys Gin 
50 55 60 

get ctt cca tat att cgc tgt ate ggt gaa tea tgg cca atg acg aaa 240 
Ala Leu Pro Tyr He Arg Cys He Gly Glu Ser Trp Pro Met Thr Lys 
65 70 75 80 

gaa aga get tat ttt gaa gca aca act ttg aga aag cat gga aat tta 288 
Glu Arg Ala Tyr Phe Glu Ala Thr Thr Leu Arg Lys His Gly Asn Leu 

85 90 95 

tea cct gat cat gtt cct gaa gtc tac cat ttt gac aga aca atg gcg 336 
Ser Pro Asp His Val Pro Glu Val Tyr His Phe Asp Arg Thr Met Ala 
100 105 110 

ttg att gga atg aga tac ctt gag cct cct cat ate att etc cgc aaa 3 84 
Leu He Gly Met Arg Tyr Leu Glu Pro Pro His He He Leu Arg Lys 
115 120 125 

gga etc att get ggg att gag tat cct ttc etc gca gac cac atg tct 432 
Gly Leu He Ala Gly He Glu Tyr Pro Phe Leu Ala Asp His Met Ser 
130 135 140 

gat tac atg gcg aag act etc ttc ttc act tct etc etc tat cac gat 480 
Asp Tyr Met Ala Lys Thr Leu Phe Phe Thr Ser Leu Leu Tyr His Asp 
145 150 155 160 

acc aca gag cac aga aga gca gta acc gaa ttt tgt ggt aat gtg gag 528 
Thr Thr Glu His Arg Arg Ala Val Thr Glu Phe Cys Gly Asn Val Glu 
165 170 175 

tta tgc cga tta acg gag caa gtt gtg ttt teg gac cca tat aga gtt 576 
Leu Cys Arg Leu Thr Glu Gin Val Val Phe Ser Asp Pro Tyr Arg Val 
180 185 190 

tec aca ttt aat cgt tgg act tea cct tat ctt gat gat gat get aag 624 
Ser Thr Phe Asn Arg Trp Thr Ser Pro Tyr Leu Asp Asp Asp Ala Lys 
195 200 205 
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get gtg cgc gaa gac agt gec ttg aag etc gaa ate gca gag eta aaa 672 

Ala Val Arg Glu Asp Ser Ala Leu Lys Leu Glu He Ala Glu Leu Lys 

210 215 220 

teg atg ttc tgt gaa aga get caa get tta ata cat ggt gat ctt cat 720 

Ser Met Phe Cys Glu Arg Ala Gin Ala Leu He His Gly Asp Leu His 
225 230 235 240 

act ggt tct gtc atg gtt act caa gat tea acg caa gtt ata gat cca 
Thr Gly Ser Val Met Val Thr Gin Asp Ser Thr Gin Val He Asp Pro 
245 250 255 

gag ttt teg ttc tat gga ccg atg ggt ttc gat att ggc get tat ctt 
Glu Phe Ser Phe Tyr Gly Pro Met Gly Phe Asp He Gly Ala Tyr Leu 
260 265 270 

ggt aac ttg ata eta get ttc ttt gca caa gat gga cac gee act cag 
Gly Asn Leu He Leu Ala Phe Phe Ala Gin Asp Gly His Ala Thr Gin 
275 280 285 

gaa aat gat cga aaa gaa tac aag cag tgg ate ttg aga ace att gag 912 
Glu Asn Asp Arg Lys Glu Tyr Lys Gin Trp He Leu Arg Thr He Glu 
290 295 300 

caa act tgg aat ttg ttt aac aaa agg ttc att gcg eta tgg gat caa 960 
Gin Thr Trp Asn Leu Phe Asn Lys Arg Phe He Ala Leu Trp Asp Gin 
305 310 315 320 

aac aaa gat gga cca ggc gaa gca tac ctt gca gat ate tat aac aat 1008 
Asn Lys Asp Gly Pro Gly Glu Ala Tyr Leu Ala Asp He Tyr Asn Asn 
325 330 335 

ace gag gtt ttg aag ttt gtt caa gaa aac tac atg agg aat ttg ttg 1056 
Thr Glu Val Leu Lys Phe Val Gin Glu Asn Tyr Met Arg Asn Leu Leu 
340 345 350 

cat gac tea etc gga ttc ggc get gca aag atg att agg aga att gtg 1104 
His Asp Ser Leu Gly Phe Gly Ala Ala Lys Met He Arg Arg He Val 
355 360 365 

gga gtg gca cat gtt gag gac ttt gaa tea ate gaa gaa gat aag cga 1152 
Gly Val Ala His Val Glu Asp Phe Glu Ser He Glu Glu Asp Lys Arg 
370 375 380 

aga get att tgc gag aga agt gca etc gag ttt gcg aag atg ctt etc 
Arg Ala He Cys Glu Arg Ser Ala Leu Glu Phe Ala Lys Met Leu Leu 
385 390 395 400 

aag gaa agg aga aag ttt aag agt ate ggt gaa gtt gtt tea gca att 1248 
Lys Glu Arg Arg Lys Phe Lys Ser He Gly Glu Val Val Ser Ala He 
405 410 415 

caa caa caa age taa 1263 
Gin Gin Gin Ser 
420 

<210> 38 
<211> 420 
<212> PRT 

<213> Arabidopsis thaliana 
<400> 38 

Met Ser Phe Glu Glu Phe Thr Pro Leu Asn Glu Lys Ser Leu Val Asp 
15 10 15 

Tyr He Lys Ser Thr Pro Ala Leu Ser Ser Lys He Gly Ala Asp Lys 
20 25 30 
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Ser Asp Asp Asp Leu Val lie Lys Glu Val Gly Asp Gly Asn Leu Asn 
35 40 45 

Phe Val Phe lie Val Val Gly Ser Ser Gly Ser Leu Val He Lys Gin 
50 55 60 

Ala Leu Pro Tyr He Arg Cys He Gly Glu Ser Trp Pro Met Thr Lys 
65 70 75 80 

Glu Arg Ala Tyr Phe Glu Ala Thr Thr Leu Arg Lys His Gly Asn Leu 

85 90 95 

Ser Pro Asp His Val Pro Glu Val Tyr His Phe Asp Arg Thr Met Ala 
100 105 110 

Leu He Gly Met Arg Tyr Leu Glu Pro Pro His He He Leu Arg Lys 
115 120 125 

Gly Leu He Ala Gly He Glu Tyr Pro Phe Leu Ala Asp His Met Ser 
130 135 140 

Asp Tyr Met Ala Lys Thr Leu Phe Phe Thr Ser Leu Leu Tyr His Asp 
145 150 155 ^ 160 

Thr Thr Glu His Arg Arg Ala Val Thr Glu Phe Cys Gly Asn Val Glu 
165 170 175 

Leu Cys Arg Leu Thr Glu Gin Val Val Phe Ser Asp Pro Tyr Arg Val 
180 185 190 

Ser Thr Phe Asn Arg Trp Thr Ser Pro Tyr Leu Asp Asp Asp Ala Lys 
195 200 205 

Ala Val Arg Glu Asp Ser Ala Leu Lys Leu Glu He Ala Glu Leu Lys 
210 215 220 

Ser Met Phe Cys Glu Arg Ala Gin Ala Leu He His Gly Asp Leu His 
225 230 235 240 

Thr Gly Ser Val Met Val Thr Gin Asp Ser Thr Gin Val He Asp Pro 
245 250 255 

Glu Phe Ser Phe Tyr Gly Pro Met Gly Phe Asp He Gly Ala Tyr Leu 
260 265 270 

Gly Asn Leu He Leu Ala Phe Phe Ala Gin Asp Gly His Ala Thr Gin 
275 280 285 

Glu Asn Asp Arg Lys Glu Tyr Lys Gin Trp He Leu Arg Thr He Glu 
290 295 300 

Gin Thr Trp Asn Leu Phe Asn Lys Arg Phe He Ala Leu Trp Asp Gin 
305 310 315 ^ 320 

Asn Lys Asp Gly Pro Gly Glu Ala Tyr Leu Ala Asp He Tyr Asn Asn 
325 330 335 

Thr Glu Val Leu Lys Phe Val Gin Glu Asn Tyr Met Arg Asn Leu Leu 
340 345 350 

His Asp Ser Leu Gly Phe Gly Ala Ala Lys Met He Arg Arg He Val 
355 360 365 

Gly Val Ala His Val Glu Asp Phe Glu Ser He Glu Glu Asp Lys Arg 
370 375 380 

Arg Ala He Cys Glu Arg Ser Ala Leu Glu Phe Ala Lys Met Leu Leu 
385 390 395 400 

Lys Glu Arg Arg Lys Phe Lys Ser He Gly Glu Val Val Ser Ala He 
405 410 415 
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<210> 39 
<211> 1200 
<212> DNA 

<213> Klebsiella pneumoniae 

<220> 

<221> CDS 

<222> (1) . . (1197) 

<223> coding for 5-methylthioribose kinase 
<400> 39 

atg teg caa tac cat acc ttc acc gec cac gat gec gtg get tac gcg 
Met Ser Gin Tyr His Thr Phe Thr Ala His Asp Ala Val Ala Tyr Ala 
15 10 15 





48 



96 



caa cag ttc gec ggc ate gac aac cca tct gag ctg gtc age gcg cag 
Gin Gin Phe Ala Gly He Asp Asn Pro Ser Glu Leu Val Ser Ala Gin 
20 25 30 

gaa gtg ggc gat ggc aac etc aat ctg gtg ttt aaa gtg ttc gat cgt 144 
Glu Val Gly Asp Gly Asn Leu Asn Leu Val Phe Lys Val Phe Asp Arg 
35 40 45 

cag ggc gtc age egg gcg ate gtc aaa cag gee ctg ccc tac gtg cgc 192 
Gin Gly Val Ser Arg Ala He Val Lys Gin Ala Leu Pro Tyr Val Arg 
50 55 60 

tgc gtc ggc gaa tec tgg ccg ctg acc etc gac cgc gee cgt etc gaa 240 
Cys Val Gly Glu Ser Trp Pro Leu Thr Leu Asp Arg Ala Arg Leu Glu 
65 70 75 80 

gcg cag acc ctg gtc gee cac tat cag cac age ccg cag cac acg gta 2 88 
Ala Gin Thr Leu Val Ala His Tyr Gin His Ser Pro Gin His Thr Val 

85 90 95 

aaa ate cat cac ttt gat ccc gag ctg gcg gtg atg gtg atg gaa gat 3 36 
Lys He His His Phe Asp Pro Glu Leu Ala Val Met Val Met Glu Asp 
100 105 110 

ctt tec gac cac cgc ate tgg cgc gga gag ctt ate get aac gtc tac 3 84 
Leu Ser Asp His Arg He Trp Arg Gly Glu Leu He Ala Asn Val Tyr 
115 120 125 

tat ccc cag gcg gee cgc cag ctt ggc gac tat ctg gcg cag gtg ttg 432 
Tyr Pro Gin Ala Ala Arg Gin Leu Gly Asp Tyr Leu Ala Gin Val Leu 
130 135 140 

ttc cac acc age gat ttc tac etc cat ccc cac gag aaa aag gcg cag 480 
Phe His Thr Ser Asp Phe Tyr Leu His Pro His Glu Lys Lys Ala Gin 
145 150 155 160 

gtg gcg cag ttt att aac ccg gcg atg tgc gag ate acc gag gat ctg 528 
Val Ala Gin Phe He Asn Pro Ala Met Cys Glu He Thr Glu Asp Leu 
165 170 175 

ttc ttt aac gac ccg tat cag ate cac gag cgc aat aac tac ccg gcg 57 6 
Phe Phe Asn Asp Pro Tyr Gin He His Glu Arg Asn Asn Tyr Pro Ala 
180 185 190 

gag ctg gag gee gat gtc gec gec ctg cgc gac gac gee cag ctt aag 624 
Glu Leu Glu Ala Asp Val Ala Ala Leu Arg Asp Asp Ala Gin Leu Lys 
195 200 205 
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ctg gcg gtg gcg gcg ctg aag cac cgt ttc ttt gcc cat gcg gaa gcg 672 
Leu Ala Val Ala Ala Leu Lys His Arg Phe Phe Ala His Ala Glu Ala 
210 215 220 

ctg ctg cac ggc gat ate cac age ggg teg ate ttc gtt gcc gaa ggt 720 
Leu Leu His Gly Asp He His Ser Gly Ser He Phe Val Ala Glu Gly 
225 230 235 240 

age ctg aag gcc ate gac gcc gag ttc ggc tac ttc ggc ccc ate ggc 768 
Ser Leu Lys Ala He Asp Ala Glu Phe Gly Tyr Phe Gly Pro He Gly 
245 250 255 

ttc gat ate ggc ace gcc ate ggc aac ctg ctg ctg aac tac tgc ggc 816 
Phe Asp lie Gly Thr Ala He Gly Asn Leu Leu Leu Asn Tyr Cys Gly 
260 265 270 

ctg ccg ggc cag etc ggc att cgc gat gcc gcc gcc gcg cgc gag cag 864 
Leu Pro Gly Gin Leu Gly He Arg Asp Ala Ala Ala Ala Arg Glu Gin 
275 280 285 

egg ctg aac gac ate cac cag ctg tgg ace ace ttc gcc gag cgc ttc 912 
Arg Leu Asn Asp He His Gin Leu Trp Thr Thr Phe Ala Glu Arg Phe 
290 * 295 300 

cag gcg ctg gcg gcg gag aaa ace cgc gac gcg gcg ctg get tac ccc 9 60 
Gin Ala Leu Ala Ala Glu Lys Thr Arg Asp Ala Ala Leu Ala Tyr Pro 
305 310 315 320 

ggc tac gcc tec gcc ttt ctg aag aaa gtc tgg gcg gac gcg gtc ggc 1008 
Gly Tyr Ala Ser Ala Phe Leu Lys Lys Val Trp Ala Asp Ala Val Gly 
325 330 335 

ttc tgc ggc age gaa ctg ate cgc cgc age gtc gga ctg teg cac gtc 1056 
Phe Cys Gly Ser Glu Leu He Arg Arg Ser Val Gly Leu Ser His Val 
340 345 350 

gcg gat ate gac act ate cag gac gac gcc atg cgt cat gag tgc ctg 1104 
Ala Asp lie Asp Thr He Gin Asp Asp Ala Met Arg His Glu Cys Leu 
355 360 365 

cgc cac gcc att ace ctg ggc aga gcg ctg ate gtg ctg gcc gag cgt 1152 
Arg His Ala He Thr Leu Gly Arg Ala Leu He Val Leu Ala Glu Arg 
370 375 380 

ate gac age gtc gac gag ctg ctg gcg egg gta cgc cag tac age tga 1200 
He Asp Ser Val Asp Glu Leu Leu Ala Arg Val Arg Gin Tyr Ser 
385 390 395 

<210> 40 
<211> 399 
<212> PRT 

<213> Klebsiella pneumoniae 
<400> 40 

Met Ser Gin Tyr His Thr Phe Thr Ala His Asp Ala Val Ala Tyr Ala 
15 10 15 

Gin Gin Phe Ala Gly He Asp Asn Pro Ser Glu Leu Val Ser Ala Gin 
20 25 30 

Glu Val Gly Asp Gly Asn Leu Asn Leu Val Phe Lys Val Phe Asp Arg 
35 40 45 

Gin Gly Val Ser Arg Ala lie Val Lys Gin Ala Leu Pro Tyr Val Arg 
50 55 60 

Cys Val Gly Glu Ser Trp Pro Leu Thr Leu Asp Arg Ala Arg Leu Glu 
65 " 70 75 80 
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Ala Gin Thr Leu Val Ala His Tyr Gin His Ser Pro Gin His Thr Val 

85 90 95 

Lys lie His His Phe Asp Pro Glu Leu Ala Val Met Val Met Glu Asp 
100 105 110 

Leu Ser Asp His Arg lie Trp Arg Gly Glu Leu lie Ala Asn Val Tyr 
115 120 125 

Tyr Pro Gin Ala Ala Arg Gin Leu Gly Asp Tyr Leu Ala Gin Val Leu 
130 135 140 

Phe His Thr Ser Asp Phe Tyr Leu His Pro His Glu Lys Lys Ala Gin 
145 150 155 ~* ~ 160 

Val Ala Gin Phe lie Asn Pro Ala Met Cys Glu lie Thr Glu Asp Leu 

165 170 175 

Phe Phe Asn Asp Pro Tyr Gin lie His Glu Arg Asn Asn Tyr Pro Ala 
180 185 190 

Glu Leu Glu Ala Asp Val Ala Ala Leu Arg Asp Asp Ala Gin Leu Lys 
195 200 205 

Leu Ala Val Ala Ala Leu Lys His Arg Phe Phe Ala His Ala Glu Ala 
210 215 220 

Leu Leu His Gly Asp lie His Ser Gly Ser lie Phe Val Ala Glu Gly 
225 230 235 240 

Ser Leu Lys Ala lie Asp Ala Glu Phe Gly Tyr Phe Gly Pro lie Gly 

245 250 255 

Phe Asp lie Gly Thr Ala lie Gly Asn Leu Leu Leu Asn Tyr Cys Gly 
260 265 270 

Leu Pro Gly Gin Leu Gly lie Arg Asp Ala Ala Ala Ala Arg Glu Gin 
275 280 285 

Arg Leu Asn Asp lie His Gin Leu Trp Thr Thr Phe Ala Glu Arg Phe 
290 295 300 

Gin Ala Leu Ala Ala Glu Lys Thr Arg Asp Ala Ala Leu Ala Tyr Pro 
305 310 315 320 

Gly Tyr Ala Ser Ala Phe Leu Lys Lys Val Trp Ala Asp Ala Val Gly 
325 330 335 

Phe Cys Gly Ser Glu Leu lie Arg Arg Ser Val Gly Leu Ser His Val 
340 345 350 

Ala Asp lie Asp Thr lie Gin Asp Asp Ala Met Arg His Glu Cys Leu 
355 360 365 

Arg His Ala lie Thr Leu Gly Arg Ala Leu lie Val Leu Ala Glu Arg 
370 375 380 

lie Asp Ser Val Asp Glu Leu Leu Ala Arg Val Arg Gin Tyr Ser 
385 390 395 



<210> 41 
<211> 1140 
<212> DNA 

<213> Arabidopsis thaliana 

<220> 

<221> CDS 

<222> (1) . . (1137) 

<223> coding for alcohol dehydrogenase 
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<400> 41 

atg tct acc acc gga cag att att cga tgc aaa get get gtg gca tgg 
Met Ser Thr Thr Gly Gin lie lie Arg Cys Lys Ala Ala Val Ala Trp 

15 10 15 

gaa gec gga aag cca ctg gtg ate gag gaa gtg gag gtt get cca ccg 
Glu Ala Gly Lys Pro Leu Val lie Glu Glu Val Glu Val Ala Pro Pro 

20 25 30 

cag aaa cac gaa gtt cgt ate aag att etc ttc act tct etc tgt cac 
Gin Lys His Glu Val Arg lie Lys He Leu Phe Thr Ser Leu Cys His 
35 40 45 

acc gat gtt tac ttc tgg gaa get aag gga caa aca ccg ttg ttt cca 
Thr Asp Val Tyr Phe Trp Glu Ala Lys Gly Gin Thr Pro Leu Phe Pro 

50 55 60 

cgt ate ttc ggc cat gaa get gga ggg att gtt gag agt gtt gga gaa 
Arg He Phe Gly His Glu Ala Gly Gly He Val Glu Ser Val Gly Glu 
65 70 75 80 

gga gtg act gat ctt cag cca gga gat cat gtg ttg ccg ate ttt acc 
Gly Val Thr Asp Leu Gin Pro Gly Asp His Val Leu Pro He Phe Thr 

85 90 95 

gga gaa tgt gga gat tgt cgt cat tgc cag teg gag gaa tea aac atg 336 
Gly Glu Cys Gly Asp Cys Arg His Cys Gin Ser Glu Glu Ser Asn Met 

100 105 HO 

tgt gat ctt etc agg ate aac aca gag cga gga ggt atg att cac gat 
Cys Asp Leu Leu Arg He Asn Thr Glu Arg Gly Gly Met He His Asp 

115 120 125 

ggt gaa tct aga ttc tec att aat ggc aaa cca ate tac cat ttc ctt 
Gly Glu Ser Arg Phe Ser He Asn Gly Lys Pro He Tyr His Phe Leu 

130 135 140 

ggg acg tec acg ttc agt gag tac act gtg gtt cac tct ggt cag gtc 
Gly Thr Ser Thr Phe Ser Glu Tyr Thr Val Val His Ser Gly Gin Val 
145 150 155 160 

get aag ate aat ccg gat get cct ctt gac aag gtc tgt att gtc agt 
Ala Lys He Asn Pro Asp Ala Pro Leu Asp Lys Val Cys He Val Ser 
165 170 175 

tgt ggt ttg tct act ggg tta gga gca act ttg aat gtg get aaa ccc 
Cys Gly Leu Ser Thr Gly Leu Gly Ala Thr Leu Asn Val Ala Lys Pro 

180 185 190 

aag aaa ggt caa agt gtt gee att ttt ggt ctt ggt get gtt ggt tta 
Lys Lys Gly Gin Ser Val Ala He Phe Gly Leu Gly Ala Val Gly Leu 

195 200 205 

ggc get gca gaa ggt get aga ate get ggt get tct agg ate ate ggt 
Gly Ala Ala Glu Gly Ala Arg He Ala Gly Ala Ser Arg He He Gly 

210 215 220 

gtt gat ttt aac tct aaa aga ttc gac caa get aag gaa ttc ggt gtg 
Val Asp Phe Asn Ser Lys Arg Phe Asp Gin Ala Lys Glu Phe Gly Val 
225 230 235 240 

acc gag tgt gtg aac ccg aaa gac cat gac aag cca att caa cag gtg 
Thr Glu Cys Val Asn Pro Lys Asp His Asp Lys Pro He Gin Gin Val 
245 250 255 

ate get gag atg acg gat ggt ggg gtg gac agg agt gtg gaa tgc acc 
He Ala Glu Met Thr Asp Gly Gly Val Asp Arg Ser Val Glu Cys Thr 
260 265 270 
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gga age gtt cag gec atg att caa gca ttt gaa tgt gtc cac gat ggc 
9 Gly Ser Val Gin Ala Met lie Gin Ala Phe Glu Cys Val His Asp Gly 
275 280 285 

tgg ggt gtt gca gtg ctg gtg ggt gtg cca age aaa gac gat gec ttc 912 
Trp Gly Val Ala Val Leu Val Gly Val Pro Ser Lys Asp Asp Ala Phe 

290 295 300 

aag act cat ccg atg aat ttc ttg aat gag agg act ctt aag ggt act 960 
Lys Thr His Pro Met Asn Phe Leu Asn Glu Arg Thr Leu Lys Gly Thr 
305 310 315 320 

ttc ttc ggg aac tac aaa ccc aaa act gac att ccc ggg gtt gtg gaa 1008 
Phe Phe Gly Asn Tyr Lys Pro Lys Thr Asp lie Pro Gly Val Val Glu 
325 330 335 

aag tac atg aac aag gag ctg gag ctt gag aaa ttc ate act cac aca 1056 
Lys Tyr Met Asn Lys Glu Leu Glu Leu Glu Lys Phe lie Thr His Thr 

340 345 350 

gtg cca ttc teg gaa ate aac aag gec ttt gat tac atg ctg aag gga 1104 
Val Pro Phe Ser Glu lie Asn Lys Ala Phe Asp Tyr Met Leu Lys Gly 

355 360 365 

gag agt att cgt tgc ate ate ace atg ggt get tga 1140 
Glu Ser lie Arg Cys lie He Thr Met Gly Ala 
370 375 

<210> 42 
<211> 379 
<212> PRT 

<213> Arabidopsis thaliana 
<400> 42 

Met Ser Thr Thr Gly Gin He He Arg Cys Lys Ala Ala Val Ala Trp 
15 10 15 

Glu Ala Gly Lys Pro Leu Val He Glu Glu Val Glu Val Ala Pro Pro 

20 25 30 

Gin Lys His Glu Val Arg He Lys He Leu Phe Thr Ser Leu Cys His 

35 40 45 

Thr Asp Val Tyr Phe Trp Glu Ala Lys Gly Gin Thr Pro Leu Phe Pro 

50 55 60 

Arg He' Phe Gly His Glu Ala Gly Gly He Val Glu Ser Val Gly Glu 
65 70 75 80 

Gly Val Thr Asp Leu Gin Pro Gly Asp His Val Leu Pro He Phe Thr 

85 90 95 

Gly Glu Cys Gly Asp Cys Arg His Cys Gin Ser Glu Glu Ser Asn Met 

100 105 HO 

Cys Asp Leu Leu Arg He Asn Thr Glu Arg Gly Gly Met He His Asp 

115 120 125 

Gly Glu Ser Arg Phe Ser He Asn Gly Lys Pro He Tyr His Phe Leu 

130 135 140 

Gly Thr Ser Thr Phe Ser Glu Tyr Thr Val Val His Ser Gly Gin Val 
145 150 155 160 

Ala Lys He Asn Pro Asp Ala Pro Leu Asp Lys Val Cys He Val Ser 
165 170 175 

Cys Gly Leu Ser Thr Gly Leu Gly Ala Thr Leu Asn Val Ala Lys Pro 
180 185 190 
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Lys Lys Gly Gin Ser Val Ala lie Phe Gly Leu Gly Ala Val Gly Leu 
195 200 205 

Gly Ala Ala Glu Gly Ala Arg lie Ala Gly Ala Ser Arg lie lie Gly 
210 215 220 

Val Asp Phe Asn Ser Lys Arg Phe Asp Gin Ala Lys Glu Phe Gly Val 
225 230 235 240 

Thr Glu Cys Val Asn Pro Lys Asp His Asp Lys Pro lie Gin Gin Val 
245 250 255 

lie Ala Glu Met Thr Asp Gly Gly Val Asp Arg Ser Val Glu Cys Thr 
260 265 270 

Gly Ser Val Gin Ala Met lie Gin Ala Phe Glu Cys Val His Asp Gly 
275 280 285 

Trp Gly Val Ala Val Leu Val Gly Val Pro Ser Lys Asp Asp Ala Phe 
290 295 300 

Lys Thr His Pro Met Asn Phe Leu Asn Glu Arg Thr Leu Lys Gly Thr 
305 310 315 320 

Phe Phe Gly Asn Tyr Lys Pro Lys Thr Asp lie Pro Gly Val Val Glu 
325 330 335 

Lys Tyr Met Asn Lys Glu Leu Glu Leu Glu Lys Phe lie Thr His Thr 
340 ~ 345 350 

Val Pro Phe Ser Glu He Asn Lys Ala Phe Asp Tyr Met Leu Lys Gly 
355 360 365 

Glu Ser He Arg Cys lie lie Thr Met Gly Ala 
370 375 




<210> 43 
<211> 1140 
<212> DNA 

<213> Hordeum vulgare 

<220> 

<221> CDS 

<222> Cb) . . (1137) 

<223> coding for alcohol dehydrogenase 
<400> 43 

atg gcg acg gcc ggc aag gtg ate aag tgc aaa gec gcg gtg gcg tgg 48 
Met Ala Thr Ala Gly Lys Val He Lys Cys Lys Ala Ala Val Ala Trp 
15 10 15 

gag gcc ggg aag ccg ctg acc atg gag gag gtg gag gtg gcg ccg ccg 96 
Glu Ala Gly Lys Pro Leu Thr Met Glu Glu Val Glu Val Ala Pro Pro 
20 25 30 

cag gcc atg gag gtg cgc gtc aag ate etc ttc acc tec etc tgc cac 144 
Gin Ala Met Glu Val Arg Val Lys lie Leu Phe Thr Ser Leu Cys His 
35 40 45 

acc gac gtc tac ttc tgg gag gcc aag ggg cag acc ccc atg ttc cct 192 
Thr Asp Val Tyr Phe Trp Glu Ala Lys Gly Gin Thr Pro Met Phe Pro 
50 55 60 

egg ate ttc ggc cat gaa get gga ggc ata gtg gag agt gtt gga gag 240 
Arg He Phe Gly His Glu Ala Gly Gly He Val Glu Ser Val Gly Glu 
65 70 75 80 
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ggc gtg act gat gtt gcc cct ggt gac cac gtc etc cct gtg ttc act 288 

Gly Val Thr Asp Val Ala Pro Gly Asp His Val Leu Pro Val Phe Thr 

85 90 95 

ggg gag tgt aag gaa tgc cca cat tgc aag tct gcg gag age aac atg 336 
Gly Glu Cys Lys Glu Cys Pro His Cys Lys Ser Ala Glu Ser Asn Met 
100 105 110 

tgt gat ctg etc agg ate aac ace gac aga ggt gtg atg ate ggg gat 384 
Cys Asp Leu Leu Arg lie Asn Thr Asp Arg Gly Val Met lie Gly Asp 
115 120 125 

ggc aag teg cgc ttc tct att ggc ggc aag ccg att tac cat ttc gta 432 
Gly Lys Ser Arg Phe Ser lie Gly Gly Lys Pro lie Tyr His Phe Val 
130 135 140 

ggg act tec ace ttc agt gag tac act gtc atg cat gtc ggt tgt gtt 480 
Gly Thr Ser Thr Phe Ser Glu Tyr Thr Val Met His Val Gly Cys Val 
145 150 155 160 

gcc aag ate aac cct gag get ccc ctt gat aaa gtc tgt gtt ctt age 528 
Ala Lys lie Asn Pro Glu Ala Pro Leu Asp Lys Val Cys Val Leu Ser 
165 170 175 

tgt ggt att tgc act ggt ctt ggc gcg tea att aat gtt gca aaa cca 576 
Cys Gly lie Cys Thr Gly Leu Gly Ala Ser lie Asn Val Ala Lys Pro 
180 185 190 

cca aag ggt tec aca gtg gcg ata ttt ggg eta gga get gtt ggc ctt 624 
Pro Lys Gly Ser Thr Val Ala He Phe Gly Leu Gly Ala Val Gly Leu 
195 200 205 

get get gca gaa ggt gca agg att gca ggt gca tea agg ate att ggt 672 
Ala Ala Ala Glu Gly Ala Arg He Ala Gly Ala Ser Arg He He Gly 
210 215 220 

gtt gac ctg aac gcc age aga ttt gaa gag get agg aag ttt ggc tgc 72 0 
Val Asp Leu Asn Ala Ser Arg Phe Glu Glu Ala Arg Lys Phe Gly Cys 
225 230 235 240 

acg gaa ttt gtg aac ccg aaa gat cac ace aag cca gtt cag cag gtg 7 68 
Thr Glu Phe Val Asn Pro Lys Asp His Thr Lys Pro Val Gin Gin Val 
245 250 255 

etc get gac atg aca aat ggc gga gtt gac cgc agt gtt gag tgc act 816 
Leu Ala Asp Met Thr Asn Gly Gly Val Asp Arg Ser Val Glu Cys Thr 
260 265 270 

ggc aac gtc aat get atg ata caa gca ttt gaa tgt gtt cat gat ggc 864 
Gly Asn Val Asn Ala Met He Gin Ala Phe Glu Cys Val His Asp Gly 
275 280 285 

tgg ggt gta get gtg ctg gtg ggt gtg cca cac aag gac get gaa ttc 912 
Trp Gly Val Ala Val Leu Val Gly Val Pro His Lys Asp Ala Glu Phe 
290 295 300 

aag acc cac ccg atg aac ttc ctg aat gag agg ace ctg aag ggc ace 960 
Lys Thr His Pro Met Asn Phe Leu Asn Glu Arg Thr Leu Lys Gly Thr 
305 310 315 320 

ttc ttc ggt aac ttc aag ccg cgc act gac ctg ccc aat gtc gtg gag 1008 
Phe Phe Gly Asn Phe Lys Pro Arg Thr Asp Leu Pro Asn Val Val Glu 
325 330 335 

atg tac atg aag aag gag ctg gag gtg gag aag ttc ate aca cac age 1056 
Met Tyr Met Lys Lys Glu Leu Glu Val Glu Lys Phe He Thr His Ser 
340 345 350 
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gtg ccg ttc teg gag ata aac aag gec ttc gac ctt atg gcg aag ggg 1104 
Val Pro Phe Ser Glu lie Asn Lys Ala Phe Asp Leu Met Ala Lys Gly 

360 365 





355 

gag ggc ate cgt tgc ate ate cgc atg gac aac tag 

Glu Gly He Arg Cys He He Arg Met Asp Asn 
370 375 

<210> 44 
<211> 379 
<212> PRT 

<213> Hordeum vulgare 
<400> 44 

Met Ala Thr Ala Gly Lys Val He Lys Cys Lys Ala Ala Val Ala Trp 
1 5 10 15 

Glu Ala Gly Lys Pro Leu Thr Met Glu Glu Val Glu Val Ala Pro Pro 
20 25 30 

Gin Ala Met Glu Val Arg Val Lys He Leu Phe Thr Ser Leu Cys His 

35 40 45 

Thr Asp Val Tyr Phe Trp Glu Ala Lys Gly Gin Thr Pro Met Phe Pro 

50 55 60 

Arg He Phe Gly His Glu Ala Gly Gly He Val Glu Ser Val Gly Glu 
65 70 75 80 

Gly Val Thr Asp Val Ala Pro Gly Asp His Val Leu Pro Val Phe Thr 

85 90 95 

Gly Glu Cys Lys Glu Cys Pro His Cys Lys Ser Ala Glu Ser Asn Met 

100 105 HO 

Cys Asp Leu Leu Arg He Asn Thr Asp Arg Gly Val Met He Gly Asp 

115 120 125 

Gly Lys Ser Arg Phe Ser He Gly Gly Lys Pro He Tyr His Phe Val 

130 135 140 

Gly Thr Ser Thr Phe Ser Glu Tyr Thr Val Met His Val Gly Cys Val 
145 150 155 160 

Ala Lys He Asn Pro Glu Ala Pro Leu Asp Lys Val Cys Val Leu Ser 
165 170 175 

Cys Gly He Cys Thr Gly Leu Gly Ala Ser He Asn Val Ala Lys Pro 
180 185 190 

Pro Lys Gly Ser Thr Val Ala He Phe Gly Leu Gly Ala Val Gly Leu 

195 200 205 

Ala Ala Ala Glu Gly Ala Arg He Ala Gly Ala Ser Arg He He Gly 

210 215 220 

Val Asp Leu Asn Ala Ser Arg Phe Glu Glu Ala Arg Lys Phe Gly Cys 
225 ~ 230 235 240 

Thr Glu Phe Val Asn Pro Lys Asp His Thr Lys Pro Val Gin Gin Val 
245 250 255 

Leu Ala Asp Met Thr Asn Gly Gly Val Asp Arg Ser Val Glu Cys Thr 
260 265 270 

Gly Asn Val Asn Ala Met He Gin Ala Phe Glu Cys Val His Asp Gly 

275 280 285 

Trp Gly Val Ala Val Leu Val Gly Val Pro His Lys Asp Ala Glu Phe 
290 295 300 



1140 
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Lys Thr His Pro Met Asn Phe Leu 
305 310 

Phe Phe Gly Asn Phe Lys Pro Arg 
325 

Met Tyr Met Lys Lys Glu Leu Glu 
340 

Val Pro Phe Ser Glu lie Asn Lys 
355 360 

Glu Gly lie Arg Cys He He Arg 
370 375 



65 




Asn Glu Arg Thr Leu Lys Gly Thr 
315 320 

Thr Asp Leu Pro Asn Val Val Glu 
330 335 

Val Glu Lys Phe He Thr His Ser 
345 350 

Ala Phe Asp Leu Met Ala Lys Gly 
365 

Met Asp Asn 



<210> 45 
<211> 1140 
<212> DNA 

<213> Oryza sativa 

<220> 

<221> CDS 

<222> (1) . . (1137) 

<223> coding for alcohol dehydrogenase 
<400> 45 

atg gcg acc gca ggg aag gtg ate aag tgc aaa gcg gcg gtg gca tgg 48 
Met Ala Thr Ala Gly Lys Val He Lys Cys Lys Ala Ala Val Ala Trp 
15 10 15 

gag gec gcg aag ccg ctg gtg ate gag gag gtg gag gtg gcg ccg ccg 96 
Glu Ala Ala Lys Pro Leu Val He Glu Glu Val Glu Val Ala Pro Pro 
20 25 30 

cag gec atg gag gtg cgc gtc aag ate etc ttc acc teg etc tgc cac 144 
Gin Ala Met Glu Val Arg Val Lys He Leu Phe Thr Ser Leu Cys His 
35 40 45 

acc gac gtc tac ttc tgg gag gee aag gga cag act ccc gtg ttc cct 192 
Thr Asp Val Tyr Phe Trp Glu Ala Lys Gly Gin Thr Pro Val Phe Pro 
50 55 60 

egg ate ttc ggc cat gaa get gga ggt att gtg gag agt gtt gga gag 240 
Arg He Phe Gly His Glu Ala Gly Gly He Val Glu Ser Val Gly Glu 
65 70 75 80 

ggt gtg act gat ctt gec cct ggt gac cat gtt etc cct gtg ttc act 288 
Gly Val Thr Asp Leu Ala Pro Gly Asp His Val Leu Pro Val Phe Thr 

85 90 95 

Q9Q gag tgc aag gag tgt gee cac tgc aag tea gca gag age aac atg 336 
Gly Glu Cys Lys Glu Cys Ala His Cys Lys Ser Ala Glu Ser Asn Met 
100 105 110 

tgt gat ctg etc agg ate aac act gac agg ggt gtg atg att ggt gat 384 
Cys Asp Leu Leu Arg He Asn Thr Asp Arg Gly Val Met He Gly Asp 
115 120 125 

ggc aaa tea cgc ttt tec ate aac ggg aag ccc att tac cat ttc gtc 432 
Gly Lys Ser Arg Phe Ser He Asn Gly Lys Pro He Tyr His Phe Val 
130 135 140 

ggg act teg acc ttc age gag tac act gtc atg cat gtt ggt tgc gtt 480 
Gly Thr Ser Thr Phe Ser Glu Tyr Thr Val Met His Val Gly Cys Val 
145 150 155 160 
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gcg aag ate aac ccg gca get cca ctt gat aaa gtt tgc gtt ctt age 528 

Ala Lys lie Asn Pro Ala Ala Pro Leu Asp Lys Val Cys Val Leu Ser 

165 170 175 

tgt ggt att tct act ggt ctt ggt get aca ate aat gtg gca aag cca 576 
Cys Gly He Ser Thr Gly Leu Gly Ala Thr He Asn Val Ala Lys Pro 
180 185 190 

cca aag ggt teg acg gtg gcg ata ttt ggt eta gga get gta ggc ctt 624 
Pro Lys Gly Ser Thr Val Ala He Phe Gly Leu Gly Ala Val Gly Leu 
195 200 205 

get gec gca gaa ggt gca agg att gca gga gcg tea agg ate att ggc 672 
Ala Ala Ala Glu Gly Ala Arg He Ala Gly Ala Ser Arg He He Gly 
210 215 220 

att gac ctg aac gee aac aga ttt gaa gaa get agg aaa ttt ggt tgc 720 
He Asp Leu Asn Ala Asn Arg Phe Glu Glu Ala Arg Lys Phe Gly Cys 
225 230 235 240 

act gaa ttt gtg aac cca aag gac cat gac aag cca gtt cag cag gta 768 
Thr Glu Phe Val Asn Pro Lys Asp His Asp Lys Pro Val Gin Gin Val 
245 250 255 

ctt get gag atg acc aat ggc gga gtt gac cgc age gtt gaa tgc act 816 
Leu Ala Glu Met Thr Asn Gly Gly Val Asp Arg Ser Val Glu Cys Thr 
260 265 270 

ggc aac ate aac gee atg ate caa gca ttt gaa tgt gtt cat gat ggc 8 64 
Gly Asn He Asn Ala Met He Gin Ala Phe Glu Cys Val His Asp Gly 
275 280 285. 

tgg ggt gtt get gtt ttg gtc ggc gtg cca cac aag gac gec gag ttc 912 
Trp Gly Val Ala Val Leu Val Gly Val Pro His Lys Asp Ala Glu Phe 
290 295 300 

aag acc cac ccg atg aac ttc ctg aac gag agg act etc aag gga acc 960 
Lys Thr His Pro Met Asn Phe Leu Asn Glu Arg Thr Leu Lys Gly Thr 
305 310 315 320 

ttc ttc ggc aac tac aag cca cgc acc gat ctg ccc aac gtc gtc gag 1008 
Phe Phe Gly Asn Tyr Lys Pro Arg Thr Asp Leu Pro Asn Val Val Glu 
325 330 335 

etc tac atg aag aag gag ctg gag gtg gag aag ttc ate aca cac age 1056 
Leu Tyr Met Lys Lys Glu Leu Glu Val Glu Lys Phe He Thr His Ser 
340 345 350 

gtg ccg ttc teg gag ate aac acg gcg ttc gac ctg atg cac aag ggc 1104 
Val Pro Phe Ser Glu He Asn Thr Ala Phe Asp Leu Met His Lys Gly 
355 360 365 

gag ggc ate cgc tgc ate ate cgc atg gag aac tga 1140 
Glu Gly He Arg Cys He He Arg Met Glu Asn 
370 375 

<210> 46 

<211> 379 

<212> PRT 

<213> Oryza sativa 

<400> 46 

Met Ala Thr Ala Gly Lys Val He Lys Cys Lys Ala Ala Val Ala Trp 
15 10 15 

Glu Ala Ala Lys Pro Leu Val He Glu Glu Val Glu Val Ala Pro Pro 
20 25 30 
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Gin Ala Met Glu Val Arg Val Lys lie Leu Phe Thr Ser Leu Cys His 
35 40 45 

Thr Asp Val Tyr Phe Trp Glu Ala Lys Gly Gin Thr Pro Val Phe Pro 
50 " 55 60 

Arg lie Phe Gly His Glu Ala Gly Gly He Val Glu Ser Val Gly Glu 
65 70 75 80 

Gly Val Thr Asp Leu Ala Pro Gly Asp His Val Leu Pro Val Phe Thr 

85 90 95 

Gly Glu Cys Lys Glu Cys Ala His Cys Lys Ser Ala Glu Ser Asn Met 
100 105 110 

Cys Asp Leu Leu Arg He Asn Thr Asp Arg Gly Val Met He Gly Asp 
115 120 125 

Gly Lys Ser Arg Phe Ser He Asn Gly Lys Pro He Tyr His Phe Val 
130 135 140 

Gly Thr Ser Thr Phe Ser Glu Tyr Thr Val Met His Val Gly Cys Val 
145 150 155 160 

Ala Lys He Asn Pro Ala Ala Pro Leu Asp Lys Val Cys Val Leu Ser 
165 170 175 

Cys Gly He Ser Thr Gly Leu Gly Ala Thr He Asn Val Ala Lys Pro 
180 185 190 

Pro Lys Gly Ser Thr Val Ala He Phe Gly Leu Gly Ala Val Gly Leu 
195 200 205 

Ala Ala Ala Glu Gly Ala Arg He Ala Gly Ala Ser Arg He He Gly 
210 215 220 

He Asp Leu Asn Ala Asn Arg Phe Glu Glu Ala Arg Lys Phe Gly Cys 
225 230 235 240 

Thr Glu Phe Val Asn Pro Lys Asp His Asp Lys Pro Val Gin Gin Val 
245 250 255 

Leu Ala Glu Met Thr Asn Gly Gly Val Asp Arg Ser Val Glu Cys Thr 
260 265 270 

Gly Asn He Asn Ala Met He Gin Ala Phe Glu Cys Val His Asp Gly 
275 280 285 

Trp Gly Val Ala Val Leu Val Gly Val Pro His Lys Asp Ala Glu Phe 
290 295 300 

Lys Thr His Pro Met Asn Phe Leu Asn Glu Arg Thr Leu Lys Gly Thr 
305 310 315 320 

Phe Phe Gly Asn Tyr Lys Pro Arg Thr Asp Leu Pro Asn Val Val Glu 
325 330 335 

Leu Tyr Met Lys Lys Glu Leu Glu Val Glu Lys Phe He Thr His Ser 
340 345 350 

Val Pro Phe Ser Glu He Asn Thr Ala Phe Asp Leu Met His Lys Gly 
355 360 365 

Glu Gly He Arg Cys He He Arg Met Glu Asn 
370 375 



<210> 47 
<211> 1140 



48 



96 
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<212> DNA 
<213> Zea mays 

<220> 
<221> CDS 
<222> (1) . . (1137) 

<223> coding for alcohol dehydrogenase 
<400> 47 

atg gcg acc gcg ggg aag gtg ate aag tgc aaa get gcg gtg gca tgg 
Met Ala Thr Ala Gly Lys Val He Lys Cys Lys Ala Ala Val Ala Trp 

15 10 15 

gag gec ggc aag cca ctg teg ate gag gag gtg gag gta gcg cct ccg 
Glu Ala Gly Lys Pro Leu Ser He Glu Glu Val Glu Val Ala Pro Pro 

20 25 30 

cag gee atg gag gtg cgc gtc aag ate etc ttc acc teg etc tgc cac 144 
Gin Ala Met Glu Val Arg Val Lys He Leu Phe Thr Ser Leu Cys His 

35 40 45 

acc gac gtc tac ttc tgg gag gee aag ggg cag act ccc gtg ttc cct 192 
Thr Asp Val Tyr Phe Trp Glu Ala Lys Gly Gin Thr Pro Val Phe Pro 

50 55 60 

egg ate ttt ggc cat gag get gga ggt ate ata gag agt gtt gga gag 240 
Arg He Phe Gly His Glu Ala Gly Gly He He Glu Ser Val Gly Glu 
65 70 75 80 

ggt gtg act gac gta get ccg ggc gac cat gtc ctt cct gtg ttc act 2 88 
Gly Val Thr Asp Val Ala Pro Gly Asp His Val Leu Pro Val Phe Thr 

85 90 95 

ggg gag tgc aag gag tgc gee cac tgc aag teg gca gag age aac atg 336 
Gly Glu Cys Lys Glu Cys Ala His Cys Lys Ser Ala Glu Ser Asn Met 

100 105 HO 

tgt gat ttg etc agg ate aac act gac cgc ggt gtg atg att ggc gat 3 84 
Cys Asp Leu Leu Arg He Asn Thr Asp Arg Gly Val Met He Gly Asp 

115 120 125 

ggc aag teg egg ttt tea ate aat ggg aag cct ate tac cac ttt gtt 432 
Gly Lys Ser Arg Phe Ser He Asn Gly Lys Pro He Tyr His Phe Val 

130 " 135 140 

ggg act tec acc ttc age gag tac acc gtc atg cat gtc ggt tgt gtt 
Gly Thr Ser Thr Phe Ser Glu Tyr Thr Val Met His Val Gly Cys Val 
145 150 155 160 

gca aag ate aac cct cag get ccc ctt gat aaa gtt tgc gtc ctt age 
Ala Lys He Asn Pro Gin Ala Pro Leu Asp Lys Val Cys Val Leu Ser 

165 170 175 

tgt ggt att tct act ggt ctt ggt gca tea att aat gtt gca aaa cct 576 
Cys Gly He Ser Thr Gly Leu Gly Ala Ser He Asn Val Ala Lys Pro 
180 185 190 

ccg aag ggt teg aca gtg get gtt ttc ggt tta gga gee gtt ggt ctt 624 

Pro Lys Gly Ser Thr Val Ala Val Phe Gly Leu Gly Ala Val Gly Leu 

195 200 205 

gee get gca gaa ggt gca agg att get gga gcg tea agg ate att ggt 672 

Ala Ala Ala Glu Gly Ala Arg He Ala Gly Ala Ser Arg He He Gly 

210 215 220 

gtc gac ctg aac ccc age aga ttc gaa gaa get agg aag ttc ggt tgc 720 

Val Asp Leu Asn Pro Ser Arg Phe Glu Glu Ala Arg Lys Phe Gly Cys 
225 ^ 230 235 240 



480 



528 
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768 



816 



864 



1008 



1056 



act gaa ttt gtg aac cca aaa gac cac aac aag ccg gtg cag gag gta 
Thr Glu Phe Val Asn Pro Lys Asp His Asn Lys Pro Val Gin Glu Val 
245 250 255 

ctt get gag atg acc aac gga ggg gtc gac cgc age gtg gaa tgc act 
Leu Ala Glu Met Thr Asn Gly Gly Val Asp Arg Ser Val Glu Cys Thr 
260 265 270 

ggc aac ate aat get atg ate caa get ttc gaa tgt gtt cat gat ggc 
Gly Asn He Asn Ala Met He Gin Ala Phe Glu Cys Val His Asp Gly 

275 280 285 

tgg ggt gtt gee gtg ctg gtg ggt gtg ccg cat aag gac get gag ttc 912 
Trp Gly Val Ala Val Leu Val Gly Val Pro His Lys Asp Ala Glu Phe 

290 295 300 

aag acc cac ccg atg aac ttc ctg aac gaa agg acc ctg aag ggg acc 9 60 
Lys Thr His Pro Met Asn Phe Leu Asn Glu Arg Thr Leu Lys Gly Thr 
305 310 315 320 

ttc ttt ggc aac tat aag cca cgc act gat ctg cca aat gtg gtg gag 
Phe Phe Gly Asn Tyr Lys Pro Arg Thr Asp Leu Pro Asn Val Val Glu 
325 330 335 

ctg tac atg aaa aag gag ctg gag gtg gag aag ttc ate acg cac age 
Leu Tyr Met Lys Lys Glu Leu Glu Val Glu Lys Phe He Thr His Ser 

340 " 345 350 

gtc ccg ttc gcg gag ate aac aag gcg ttc aac ctg atg gee aag ggg 1104 
Val Pro Phe Ala Glu He Asn Lys Ala Phe Asn Leu Met Ala Lys Gly 

355 360 365 

gag ggc ate cgc tgc ate ate cgc atg gag aac tag 1140 
Glu Gly He Arg Cys He He Arg Met Glu Asn 
370 375 

<210> 48 
<211> 379 
<212> PRT 
<213> Zea mays 

<400> 48 

Met Ala Thr Ala Gly Lys Val He Lys Cys Lys Ala Ala Val Ala Trp 
1 5 10'15 

Glu Ala Gly Lys Pro Leu Ser He Glu Glu Val Glu Val Ala Pro Pro 
20 25 30 

Gin Ala Met Glu Val Arg Val Lys He Leu Phe Thr Ser Leu Cys His 
35 40 45 

Thr Asp Val Tyr Phe Trp Glu Ala Lys Gly Gin Thr Pro Val Phe Pro 

50 55 60 

Arg He Phe Gly His Glu Ala Gly Gly He He Glu Ser Val Gly Glu 
65 70 75 80 

Gly Val Thr Asp Val Ala Pro Gly Asp His Val Leu Pro Val Phe Thr 

85 90 95 

Gly Glu Cys Lys Glu Cys Ala His Cys Lys Ser Ala Glu Ser Asn Met 
100 105 HO 

Cys Asp Leu Leu Arg He Asn Thr Asp Arg Gly Val Met He Gly Asp 
115 120 125 

Gly Lys Ser Arg Phe Ser He Asn Gly Lys Pro He Tyr His Phe Val 
130 135 140 
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Gly Thr Ser Thr Phe Ser Glu Tyr Thr Val Met His Val Gly Cys Val 
145 150 155 160 

Ala Lys He Asn Pro Gin Ala Pro Leu Asp Lys Val Cys Val Leu Ser 
165 170 175 

Cys Gly He Ser Thr Gly Leu Gly Ala Ser He Asn Val Ala Lys Pro 
180 185 190 

Pro Lys Gly Ser Thr Val Ala Val Phe Gly Leu Gly Ala Val Gly Leu 
195 200 205 

Ala Ala Ala Glu Gly Ala Arg He Ala Gly Ala Ser Arg He He Gly 
210 215 220 

Val Asp Leu Asn Pro Ser Arg Phe Glu Glu Ala Arg Lys Phe Gly Cys 
225 230 235 240 

Thr Glu Phe Val Asn Pro Lys Asp His Asn Lys Pro Val Gin Glu Val 
245 250 255 

Leu Ala Glu Met Thr Asn Gly Gly Val Asp Arg Ser Val Glu Cys Thr 
260 265 270 

Gly Asn He Asn Ala Met He Gin Ala Phe Glu Cys Val His Asp Gly 
275 280 285 

Trp Gly Val Ala Val Leu Val Gly Val Pro His Lys Asp Ala Glu Phe 
290 295 300 

Lys Thr His Pro Met Asn Phe Leu Asn Glu Arg Thr Leu Lys Gly Thr 
305 310 315 320 

Phe Phe Gly Asn Tyr Lys Pro Arg Thr Asp Leu Pro Asn Val Val Glu 
325 330 335 

Leu Tyr Met Lys Lys Glu Leu Glu Val Glu Lys Phe He Thr His Ser 
340 345 350 

Val Pro Phe Ala Glu He Asn Lys Ala Phe Asn Leu Met Ala Lys Gly 
355 360 365 

Glu Gly He Arg Cys He He Arg Met Glu Asn 
370 375 



<210> 49 
<211> 505 
<212> DNA 

<213> Klmstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: coding for 
sense RNA— fragment of E.coli codA gene 

<400> 49 

aagcttggct aacagtgtcg aataacgctt tacaaacaat tattaacgcc cggttaccag 60 
gcgaagaggg gctgtggcag attcatctgc aggacggaaa aatcagcgcc attgatgcgc 120 
aatccggcgt gatgcccata actgaaaaca gcctggatgc cgaacaaggt ttagttatac 180 
cgccgtttgt ggagccacat attcacctgg acaccacgca aaccgccgga caaccgaact 240 
ggaatcagtc cggcacgctg tttgaaggca ttgaacgctg ggccgagcgc aaagcgttat 300 
taacccatga cgatgtgaaa caacgcgcat ggcaaacgct gaaatggcag attgccaacg 360 
gcattcagca tgtgcgtacc catgtcgatg tttcggatgc aacgctaact gcgctgaaag 420 
caatgctgga agtgaagcag gaagtcgcgc cgtggattga tctgcaaatc gtcgccttcc 480 
ctcaggaagg gattttgtcg tcgac 505 



<210> 50 
<211> 27 
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<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: 
oligonucleotide primer 

<400> 50 

aagcttggct aacagtgtcg aataacg 27 

<210> 51 
<211> 26 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: 
oligonucleotide primer 

<400> 51 

gtcgacgaca aaatcccttc ctgagg 26 

<210> 52 
<211> 505 
. <212> DNA 
<213> Kunstliche Sequenz 

<220> 

<223> Beschreibung der kiinstlichen Sequenz: coding for 
antisense RNA-fragment of E.coli codA gene 

<400> 52 

gaattcggct aacagtgtcg aataacgctt tacaaacaat tattaacgcc cggttaccag 60 
gcgaagaggg gctgtggcag attcatctgc aggacggaaa aatcagcgcc attgatgcgc 120 
aatccggcgt gatgcccata actgaaaaca gcctggatgc cgaacaaggt ttagttatac 180 
cgccgtttgt ggagccacat attcacctgg acaccacgca aaccgccgga caaccgaact 240 
ggaatcagtc cggcacgctg tttgaaggca ttgaacgctg ggccgagcgc aaagcgttat 3 00 
taacccatga cgatgtgaaa caacgcgcat ggcaaacgct gaaatggcag attgccaacg 3 60 
gcattcagca tgtgcgtacc catgtcgatg tttcggatgc aacgctaact gcgctgaaag 420 
caatgctgga agtgaagcag gaagtcgcgc cgtggattga tctgcaaatc gtcgccttcc 480 
ctcaggaagg gattttgtcg gatcc 505 

<210> 53 
<211> 27 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: 
oligonucleotide primer 

<400> 53 

gaattcggct aacagtgtcg aataacg 27 

<210> 54 
<211> 26 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: 
oligonucleotide primer 



<400> 54 

ggatccgaca aaatcccttc ctgagg 



26 
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<210> 55 
<211> 5674 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: vector 
construct pBluKS-nitP-STLSl-35S-T 



<400> 55 

ccagcttttg 

tgtttcctgt 

taaagtgtaa 

cactgcccgc 

gcgcggggag 

tgcgctcggt 

tatccacaga 

ccaggaaccg 

agcatcacaa 

accaggcgtt 

ccggatacct 

"gtaggtatct 

ccgttcagcc 

gacacgactt 

taggcggtgc 

tatttggtat 

gatccggcaa 

cgcgcagaaa 

agtggaacga 

cctagatcct 

cttggtctga 

ttcgttcatc 

taccatctgg 

tatcagcaat 

ccgcctccat 

atagtttgcg 

gtatggcttc 

tgtgcaaaaa 

cagtgttatc 

taagatgctt 

ggcgaccgag 

ctttaaaagt 

cgctgttgag 

ttactttcac 

gaataagggc 

gcatttatca 

aacaaatagg 

gcgcattaag 

ccctagcgcc 

cccgtcaagc 

tcgaccccaa 

cggtttttcg 

ctggaacaac 

tttcggccta 

aaatattaac 

atcggtgcgg 

attaagttgg 

attgtaatac 



ttccctttag 
gtgaaattgt 
agcctggggt 
tttccagtcg 
aggcggtttg 
cgttcggctg 
atcaggggat 
taaaaaggcc 
aaatcgacgc 
tccccctgga 
gtccgccttt 
cagttcggtg 
cgaccgctgc 
atcgccactg 
tacagagttc 
ctgcgctctg 
acaaaccacc 
aaaaggatct 
aaactcacgt 
tttaaattaa 
cagttaccaa 
catagttgcc 
ccccagtgct 
aaaccagcca 
ccagtctatt 
caacgttgtt 
attcagctcc 
agcggttagc 
actcatggtt 
ttctgtgact 
ttgctcttgc 
gctcatcatt 
atccagttcg 
cagcgtttct 
gacacggaaa 
gggttattgt 
ggttccgcgc 
cgcggcgggt 
cgctcctttc 
tctaaatcgg 
aaaacttgat 
ccctttgacg 
actcaaccct 
ttggttaaaa 
gcttacaatt 
gcctcttcgc 
gtaacgccag 
gactcactat 



tgagggttaa 
tatccgctca 
gcctaatgag 
ggaaacctgt 
cgtattgggc 
cggcgagcgg 
aacgcaggaa 
gcgttgctgg 
tcaagtcaga 
agctccctcg 
ctcccttcgg 
taggtcgttc 
gccttatccg 
gcagcagcca 
ttgaagtggt 
ctgaagccag 
gctggtagcg 
caagaagatc 
taagggattt 
aaatgaagtt 
tgcttaatca 
tgactccccg 
gcaatgatac 
gccggaaggg 
aattgttgcc 
gccattgcta 
ggttcccaac 
tccttcggtc 
atggcagcac 
ggtgagtact 
ccggcgtcaa 
ggaaaacgtt 
atgtaaccca 
gggtgagcaa 
tgttgaatac 
ctcatgagcg 
acatttcccc 
gtggtggtta 
gctttcttcc 
gggctccctt 
tagggtgatg 
ttggagtcca 
atctcggtct 
aatgagctga 
tccattcgcc 
tattacgcca 
ggttttccca 
agggcgaatt 



tttcgagctt 

caattccaca' 

tgagctaact 

cgtgccagct 

gctcttccgc 

tatcagctca 

agaacatjgtg 

cgtttttcca 

ggtggcgaaa 

tgcgctctcc 

gaagcgtggc 

gctccaagct 

gtaactatcg 

ctggtaacag 

ggcctaacta 

ttaccttcgg 

gtggtttttt 

ctttgatctt 

tggtcatgag 

ttaaatcaat 

gtgaggcacc 

tcgtgtagat 

cgcgagaccc 

ccgagcgcag 

gggaagctag 

caggcatcgt 

gatcaaggcg 

ctccgatcgt 

tgcataattc 

caaccaagtc 

tacgggataa 

cttcggggcg 

ctcgtgcacc 

aaacaggaag 

tcatactctt 

gatacatatt 

gaaaagtgcc 

cgcgcagcgt 

cttcctttct 

tagggttccg 

gttcacgtag 

cgttctttaa 

attcttttga 

tttaacaaaa 

attcaggctg 

gctggcgaaa 

gtcacgacgt 

ggagctcgtc 



ggcgtaatca 
caacatacga 
cacattaatt 
gcattaatga 
ttcctcgctc 
ctcaaaggcg 
agcaaaaggc 
taggctccgc 
cccgacagga' 
tgttccgacc 
gctttctcat 
gggctgtgtg 
tcttgagtcc 
gattagcaga 
cggctacact 
aaaaagagtt 
tgtttgcaag 
ttctacgggg 
attatcaaaa 
ctaaagtata 
tatctcagcg 
aactacgata 
acgctcaccg 
aagtggtcct 
agtaagtagt 
ggtgtcacgc 
agttacatga 
tgtcagaagt 
tcttactgtc 
attctgagaa 
taccgcgcca 
aaaactctca 
caactgatct 
gcaaaatgcc 
cctttttcaa 
tgaatgtatt 
acctgacgcg 
gaccgctaca 
cgccacgttc 
atttagtgct 
tgggccatcg 
tagtggactc 
tttataaggg 
atttaacgcg 
cgcaactgtt 

gggggatgtg 

tgtaaaacga 
gagaccagat 



tggtcatagc 
gccggaagca 
gcgttgcgct 
atcggccaac 
actgact;cgc 
gtaatacggt 
cagcaaaagg 
ccccctgacg 
ctataaagat 
ctgccgctta 
agctcacgct 
cacgaacccc 
aacccggtaa 
gcgaggtatg 
agaaggacag 
ggtagctctt 
cagcagatta 
tctgacgctc 
aggatcttca 
tatgagtaaa 
atctgtctat 
cgggagggct 
gctccagatt 
gcaactttat 
tcgccagtta 
tcgtcgtttg 
tcccccatgt 
aagttggccg 
atgccatccg 
tagtgtatgc 
catagcagaa 
aggatcttac 
tcagcatctt 
gcaaaaaagg 
tattattgaa 
tagaaaaata 
ccctgtagcg 
cttgccagcg 
gccggctttc 
ttacggcacc 
ccctgataga 
ttgttccaaa 
attttgccga 
aattttaaca 
gggaagggcg 
ctgcaaggcg 
cggccagtga 
gttttacact 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

960 

1020 

1080 

1140 

1200 

1260 

1320 

1380 

1440 

1500 

1560 

1620 

1680 

1740 

1800 

1860 

1920 

1980 

2040 

2100 

2160 

2220 

2280 

2340 

2400 

2460 

2520 

2580 

2640 

2700 

2760 

2820 

2880 
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tgaccgtaaa tgagcacccg aagaaaccgg tcacattcat ttcgaaggtg gagaaagcgg 2940 
aagatgactc aaacaagtaa tcggttgtga ttcgtcagtt catgtcactc ctatgaagga 3000 
gtcaagttca aaatgttatg ttgagtttca aacttttatg ctaaactttt tttctttatt 3060 
ttcgttaata atggaagaga accaattctc ttgtatctaa agattatcca tctatcatcc 3120 
aatttgagtg ttcaattctg gatgttgtgt taccctacat tctacaacca tgtagccaat 3180 
tattatgaat ctggctttga tttcagttgt gttcttttct tttttttctt tgcatatttg 3240 
catttagaat gtttaataat taagttactg tatttccaca tacattagtt ccaagaatat 3300 
acatatatta atttattttt cttaaaaatg ttttggaatg actaatattg acaacgaaaa 3360 
tagaagctat gctaaaccat tacgtatatg tgacttcaca tgttgttgtt ttacattccc 3420 
tatatatatg gatggctgtc acaatcagaa acgtgatcga aaaaagacaa acagtgtttg 348 0 
cataaaaaga ctatttcgtt tcattgacaa tttgtgttta tttgtaaaga aaagtggcaa 3540 
agtggaattt gagttcctgc aagtaagaaa gatgaaataa aagacttgag tgtgtgtttt 3600 
tttcttttat ctgaaagctg caatgaaata ttcctaccaa gcccgtttga ttattaattg 3 660 
gggtttggtt ttcttgatgc gaactaattg gttatataag aaactataca atccatgtta 3720 
attcaaaaat tttgatttct cttgtaggaa tatgatttac tatatgagac tttcttttcg 3780 
ccaataatag taaatccaaa gatatttgac cggaccaaaa cacattgatc tattttttag 3 840 
tttatttaat ccagtttctc tgagataatt cattaaggaa aacttagtat taacccatcc 3900 
taagattaaa taggagccaa actcacattt caaatattaa ataacataaa atggatttaa 3960 
aaaatctata cgtcaaattt tatttatgac atttcttatt taaatttata tttaatgaaa 4020 
tacagctaag acaaaccaaa aaaaaaatac tttctaagtg gtccaaaaca tcaattccgt 4080 
tcaatattat taggtagaat cgtacgacca aaaaaaggta ggttaatacg aattagaaac 4140 
atatctataa catagtatat attattacct attatgagga atcaaaatgc atcaaatatg 4200 
gatttaagga atccataaaa gaataaattc tacgggaaaa aaaatggaat aaattctttt 4260 
aagtttttta tttgtttttt atttggtagt tctccatttt gttttatttc gtttggattt 4320 
attgtgtcca aatactttgt aaaccaccgt tgtaattctt aaacggggtt ttcacttctt 4380 
ttttatattc agacataaag catcggctgg tttaatcaat caatagattt tatttttctt 4440 
ctcaattatt agtaggtttg atgtgaactt tacaaaaaaa acaaaaacaa atcaatgcag 4500 
agaaaagaaa ccacgtgggc tagtcccacc ttgtttcatt tccaccacag gttcgatctt 4560 
cgttaccgtc tccaatagga aaataaacgt gaccacaaaa aaaaaacaaa aaaaagtcta 4620 
tatattgctt ctctcaagtc tctgagtgtc atgaaccaaa gtaaaaaaca aagactcgac 4 680 
ctgcaggcat gcaagcttat cgtcgactac gtaagtttct gcttctacct ttgatatata 4740 
tataataatt atcattaatt agtagtaata taatatttca aatatttttt tcaaaataaa 4800 
agaatgtagt atatagcaat tgcttttctg tagtttataa gtgtgtatat tttaatttat 4860 
aacttttcta atatatgacc aaaatttgtt gatgtgcagg tatcaccgga tccatcgaat 4920 
tcggtacgct gaaatcacca gtctctctct acaaatctat ctctctctat tttctccata 4980 
aataatgtgt gagtagtttc ccgataaggg gaanttaggg ttcttatagg gtttcgctca 5040 
tgtgttgagc atataagaaa cccttagtat gtatttgtat ttgtaaaata cttctatcaa 5100 
taaaatttct aattcctaaa accaaaatcc agtactaaaa tccagatctc ctaaagtccc 5160 
tatagatctt tgtcgtgaat ataaaccaga cacgagacga ctaaacctgg agcccagacg 5220 
ccgttcgaag ctagaagtac cgcttaggca ggaggccgtt agggaaaaga tgctaaggca 5280 
gggttggtta cgttgactcc cccgtaggfct tggtttaaat atgatgaagt ggacggaagg 5340 
aaggaggaag acaaggaagg ataaggttgc aggccctgtg caaggtaaga agatggaaat 5400 
ttgatagagg tacgctacta tacttatact atacgctaag ggaatgcttg tatttatacc 5460 
ctataccccc taataacccc ttatcaattt aagaaataat ccgcataagc ccccgcttaa 5520 
aaattggtat cagagccatg aataggtcta tgaccaaaac tcaagaggat aaaacctcac 5580 
caaaatacga aagagttctt aactctaaag ataaaagatc tttcaagatc aaaactagtt 5640 
ccctcacacc ggtgacgggg atcgcgatgg gtac 5674 

<210> 56 
<211> 6046 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der ktinstlichen Sequenz: binary 
vector pSUNl 

<400> 56 

ttccatggac atacaaatgg acgaacggat aaaccttttc acgccctttt aaatatccga 60 
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ttattctaat aaacgctctt ttctcttagg tttacccgcc aatatatcct gtcaaacact 120 
gatagtttaa actgaaggcg ggaaacgaca atcagatcta gtaggaaaca gctatgacca 180 
tgattacgcc aagcttgcat gcctgcaggt cgactctaga ctagtggatc cgatatcgcc 240 
cgggctcgag gtaccgagct cgaattcact ggccgtcgtt ttacaacgac tcagctgctt 300 
ggtaataatt gtcattagat tgtttttatg catagatgca ctcgaaatca gccaatttta 3 60 
gacaagtatc aaacggatgt taattcagta cattaaagac gtccgcaatg tgttattaag 420 
ttgtctaagc gtcaatttgt ttacaccaca atatatcctg ccaccagcca gccaacagct 480 
ccccgaccgg cagctcggca caaaatcacc acgcgttacc accacgccgg ccggccgcat 540 
ggtgttgacc gtgttcgccg gcattgccga gttcgagcgt tccctaatca tcgaccgcac 600 
ccggagcggg cgcgaggccg ccaaggcccg aggcgtgaag tttggccccc gccctaccct 660 
caccccggca cagatcgcgc acgcccgcga gctgatcgac caggaaggcc gcaccgtgaa 720 
agaggcggct gcactgcttg gcgtgcatcg ctcgaccctg taccgcgcac ttgagcgcag 780 
cgaggaagtg acgcccaccg aggccaggcg gcgcggtgcc ttccgtgagg acgcattgac 840 
cgaggccgac gccctggcgg ccgccgagaa tgaacgccaa gaggaacaag catgaaaccg 900 
caccaggacg gccaggacga accgtttttc attaccgaag agatcgaggc ggagatgatc 960 
gcggccgggt acgtgttcga gccgcccgcg cacgtctcaa ccgtgcggct gcatgaaatc 102 0 
ctggccggtt tgtctgatgc caagctggcg gcctggccgg ccagcttggc cgctgaagaa 1080 
accgagcgcc gccgtctaaa aaggtgatgt gtatttgagt aaaacagctt gcgtcatgcg 1140 
gtcgctgcgt -atatgatgcg atgagtaaat aaacaaatac gcaaggggaa cgcatgaagg 1200 
ttatcgctgt acttaaccag aaaggcgggt caggcaagac gaccatcgca acccatctag 1260 
cccgcgccct gcaactcgcc ggggccgatg ttctgttagt cgattccgat ccccagggca 1320 
gtgcccgcga ttgggcggcc gtgcgggaag atcaaccgct aaccgttgtc ggcatcgacc 1380 
gcccgacgat tgaccgcgac gtgaaggcca tcggccggcg cgacttcgta gtgatcgacg 1440 
gagcgcccca ggcggcggac ttggctgtgt ccgcgatcaa ggcagccgac ttcgtgctga 1500 
ttccggtgca gccaagccct tacgacatat gggccaccgc cgacctggtg gagctggtta 1560 
agcagcgcat tgaggtcacg gatggaaggc tacaagcggc ctttgtcgtg tcgcgggcga 162 0 
tcaaaggcac gcgcatcggc ggtgaggttg ccgaggcgct ggccgggtac gagctgccca 1680 
ttcttgagtc ccgtatcacg cagcgcgtga gctacccagg cactgccgcc gccggcacaa 1740 
ccgttcttga atcagaaccc gagggcgacg ctgcccgcga ggtccaggcg ctggccgctg 1800 
aaattaaatc aaaactcatt tgagttaatg aggtaaagag aaaatgagca aaagcacaaa 1860 
cacgctaagt gccggccgtc cgagcgcacg cagcagcaag gctgcaacgt tggccagcct 1920 
ggcagacacg ccagccatga agcgggtcaa ctttcagttg ccggcggagg atcacaccaa 1980 
gctgaagatg tacgcggtac gccaaggcaa gaccattacc gagctgctat ctgaatacat 2040 
cgcgcagcta ccagagtaaa tgagcaaatg aataaatgag tagatgaatt ttagcggcta 2100 
aaggaggcgg catggaaaat caagaacaac caggcaccga cgccgtggaa tgccccatgt 2160 
gtggaggaac gggcggttgg ccaggcgtaa gcggctgggt tgtctgccgg ccctgcaatg 2220 
gcactggaac ccccaagccc gaggaatcgg cgtgagcggt cgcaaaccat ccggcccggt 2280 
acaaatcggc gcggcgctgg gtgatgacct ggtggagaag ttgaaggccg cgcaggccgc 2340 
ccagcggcaa cgcatcgagg cagaagcacg ccccggtgaa tcgtggcaag cggccgctga 2400 
tcgaatccgc aaagaatccc ggcaaccgcc ggcagccggt gcgccgtcga ttaggaagcc 2460 
gcccaagggc gacgagcaac cagatttttt cgttccgatg ctctatgacg tgggcacccg 2520 
cgatagtcgc agcatcatgg acgtggccgt tttccgtctg tcgaagcgtg accgacgagc 2580 
tggcgaggtg atccgctacg agcttccaga cgggcacgta gaggtttccg cagggccggc 2 640 
cggcatggcc agtgtgtggg attacgacct ggtactgatg gcggtttccc atctaaccga 2700 
atccatgaac cgataccggg aagggaaggg agacaagccc ggccgcgtgt tccgtccaca 2760 
cgttgcggac gtactcaagt tctgccggcg agccgatggc ggaaagcaga aagacgacct 2820 
ggtagaaacc tgcattcggt taaacaccac gcacgttgcc atgcagcgta cgaagaaggc 2880 
caagaacggc cgcctggtga cggtatccga gggtgaagcc ttgattagcc gctacaagat 2940 
cgtaaagagc gaaaccgggc ggccggagta catcgagatc gagctagctg attggatgta 3000 
ccgcgagatc acagaaggca agaacccgga cgtgctgacg gttcaccccg attacttttt 3060 
gatcgatccc ggcatcggcc gttttctcta ccgcctggca cgccgcgccg caggcaaggc 3120 
agaagccaga tggttgttca agacgatcta cgaacgcagt ggcagcgccg gagagttcaa 3180 
gaagttctgt ttcaccgtgc gcaagctgat cgggtcaaat gacctgccgg agtacgattt 3240 
gaaggaggag gcggggcagg ctggcccgat cctagtcatg cgctaccgca acctgatcga 3300 
gggcgaagca tccgccggtt cctaatgtac ggagcagatg ctagggcaaa ttgccctagc 33 60 
aggggaaaaa ggtcgaaaag gtctctttcc tgtggatagc acgtacattg ggaacccaaa 3420 
gccgtacatt gggaaccgga acccgtacat tgggaaccca aagccgtaca ttgggaaccg 3480 
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gtcacacatg taagtgactg atataaaaga gaaaaaaggc gatttttccg cctaaaactc 3540 
tttaaaactt attaaaactc ttaaaacccg cctggcctgt gcataactgt ctggccagcg 3 600 
cacagccgaa gagctgcaaa aagcgcctac ccttcggtcg ctgcgctccc tacgccccgc 3660 
cgcttcgcgt cggcctatcg cggccgctgg ccgctcaaaa atggctggcc tacggccagg 3720 
caatctacca gggcgcggac aagccgcgcc gtcgccactc gaccgccggc gcccacatca 3780 
aggcaccctg cctcgcgcgt ttcggtgatg acggtgaaaa cctctgacac atgcagctcc 3 840 
cggagacggt cacagcttgt ctgtaagcgg atgccgggag cagacaagcc cgtcagggcg 3900 
cgtcagcggg tgttggcggg tgtcggggcg cagccatgac ccagtcacgt agcgatagcg 3960 
gagtgtatac tggcttaact atgcggcatc agagcagatt gtactgagag tgcaccatat 4020 
gcggtgtgaa ataccgcaca gatgcgtaag gagaaaatac cgcatcaggc gctcttccgc 4080 
ttcctcgctc actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca 4140 
ctcaaaggcg gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg 4200 
agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca 4260 
taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa 4320 
cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc 4380 
tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc 4440 
gctttctcat agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct 4500 
gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg 4560 
tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag 4620 
gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta 4680 
cggctacact agaaggacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg 4740 
aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt 4800 
tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt 4860 
ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgca 4920 
tgatatatct cccaatttgt gtagggctta ttatgcacgc ttaaaaataa taaaagcaga 4980 
cttgacctga tagtttggct gtgagcaatt atgtgcttag tgcatctaac gcttgagtta 5040 
agccgcgccg cgaagcggcg tcggcttgaa cgaatttcta gctagacatt atttgccgac 5100 
taccttggtg atctcgcctt tcacgtagtg gacaaattct tccaactgat ctgcgcgcga 5160 
ggccaagcga tcttcttctt gtccaagata agcctgtcta gcttcaagta tgacgggctg 5220 
atactgggcc ggcaggcgct ccattgccca gtcggcagcg acatccttcg gcgcgatttt 5280 
gccggttact gcgctgtacc aaatgcggga caacgtaagc actacatttc gctcatcgcc 5340 
agcccagtcg ggcggcgagt tccatagcgt taaggtttca tttagcgcct caaatagatc 5400 
ctgttcagga accggatcaa agagttcctc cgccgctgga cctaccaagg caacgctatg 5460 
ttctcttgct tttgtcagca agatagccag atcaatgtcg atcgtggctg gctcgaagat 5520 
acctgcaaga atgtcattgc gctgccattc tccaaattgc agttcgcgct tagctggata 5580 
acgccacgga atgatgtcgt cgtgcacaac aatggtgact tctacagcgc ggagaatctc 5640 
gctctctcca ggggaagccg aagtttccaa aaggtcgttg atcaaagctc gccgcgttgt 5700 
ttcatcaagc cttacggtca ccgtaaccag caaatcaata tcactgtgtg gcttcaggcc 57 60 
gccatccact gcggagccgt acaaatgtac ggccagcaac gtcggttcga gatggcgctc 5820 
gatgacgcca actacctctg atagttgagt cgatacttcg gcgatcaccg cttcccccat 5880 
gatgtttaac tttgttttag ggcgactgcc ctgctgcgta acatcgttgc tgctccataa 5940 
catcaaacat cgacccacgg cgtaacgcgc ttgctgcttg gatgcccgag gcatagactg 6000 
taccccaaaa aaacagtcat aacaagccat gaaaaccgcc actgcg 6046 

<210> 57 
<211> 9838 
<212> DNA 

<213> Kunstliche Sequenz 



<223> Beschreibung der kunstlichen Sequenz: Transgenic 
expression vector for codA dsRNA pSUNl-codA-RNAi 

<400> 57 

cgaattcact ggccgtcgtt ttacaacgac tcagctgctt ggtaataatt gtcattagat 60 

tgtttttatg catagatgca ctcgaaatca gccaatttta gacaagtatc aaacggatgt 120 

taattcagta cattaaagac gtccgcaatg tgttattaag ttgtctaagc gtcaatttgt 180 

ttacaccaca atatatcctg ccaccagcca gccaacagct ccccgaccgg cagctcggca 240 

caaaatcacc acgcgttacc accacgccgg ccggccgcat ggtgttgacc gtgttcgccg 300 



<220> 
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gcattgccga gttcgagcgt tccctaatca tcgaccgcac ccggagcggg cgcgaggccg 3 60 
ccaaggcccg aggcgtgaag tttggccccc gccctaccct caccccggca cagatcgcgc 420 
acgcccgcga gctgatcgac caggaaggcc gcaccgtgaa agaggcggct gcactgcttg 480 
gcgtgcatcg ctcgaccctg taccgcgcac ttgagcgcag cgaggaagtg acgcccaccg 540 
aggccaggcg gcgcggtgcc ttccgtgagg acgcattgac cgaggccgac gccctggcgg 600 
ccgccgagaa tgaacgccaa gaggaacaag catgaaaccg caccaggacg gccaggacga 660 
accgtttttc attaccgaag agatcgaggc ggagatgatc gcggccgggt acgtgttcga 720 
gccgcccgcg cacgtctcaa ccgtgcggct gcatgaaatc ctggccggtt tgtctgatgc 7 80 
caagctggcg gcctggccgg ccagcttggc cgctgaagaa accgagcgcc gccgtctaaa 840 
aaggtgatgt gtatttgagt aaaacagctt gcgtcatgcg gtcgctgcgt atatgatgcg 900 
atgagtaaat aaacaaatac gcaaggggaa cgcatgaagg ttatcgctgt acttaaccag 960 
aaaggcgggt caggcaagac gaccatcgca acccatctag cccgcgccct gcaactcgcc 102 0 
ggggccgatg ttctgttagt cgattccgat ccccagggca gtgcccgcga ttgggcggcc 1080 
gtgcgggaag atcaaccgct aaccgttgtc ggcatcgacc gcccgacgat tgaccgcgac 1140 
gtgaaggcca tcggccggcg cgacttcgta gtgatcgacg gagcgcccca ggcggcggac 1200 
ttggctgtgt ccgcgatcaa ggcagccgac ttcgtgctga ttccggtgca gccaagccct 12 60 
tacgacatat gggccaccgc cgacctggtg gagctggtta agcagcgcat tgaggtcacg 1320 
gatggaaggc tacaagcggc ctttgtcgtg tcgcgggcga tcaaaggcac gcgcatcggc 1380 
ggtgaggttg ccgaggcgct ggccgggtac gagctgccca ttcttgagtc ccgtatcacg 1440 
cagcgcgtga gctacccagg cactgccgcc gccggcacaa ccgttcttga atcagaaccc 1500 
gagggcgacg ctgcccgcga ggtccaggcg ctggccgctg aaattaaatc aaaactcatt 1560 
tg'agttaatg aggtaaagag aaaatgagca aaagcacaaa cacgctaagt gccggccgtc 162 0 
cgagcgcacg cagcagcaag gctgcaacgt tggccagcct ggcagacacg ccagccatga 1680 
agcgggtcaa ctttcagttg ccggcggagg atcacaccaa gctgaagatg tacgcggtac 1740 
gccaaggcaa gaccattacc gagctgctat ctgaatacat cgcgcagcta ccagagtaaa 1800 
tgagcaaatg aataaatgag tagatgaatt ttagcggcta aaggaggcgg catggaaaat 1860 
caagaacaac caggcaccga cgccgtggaa tgccccatgt gtggaggaac gggcggttgg 1920 
ccaggcgtaa gcggctgggt tgtctgccgg ccctgcaatg gcactggaac ccccaagccc 1980 
gaggaatcgg cgtgagcggt cgcaaaccat ccggcccggt acaaatcggc gcggcgctgg 2 040 
gtgatgacct ggtggagaag ttgaaggccg cgcaggccgc ccagcggcaa cgcatcgagg 2100 
cagaagcacg ccccggtgaa tcgtggcaag cggccgctga tcgaatccgc aaagaatccc 2160 
ggcaaccgcc ggcagccggt gcgccgtcga ttaggaagcc gcccaagggc gacgagcaac 2220 
cagatttttt cgttccgatg ctctatgacg tgggcacccg cgatagtcgc agcatcatgg 2280 
acgtggccgt tttccgtctg tcgaagcgtg accgacgagc tggcgaggtg atccgctacg 2340 
agcttccaga cgggcacgta gaggtttccg cagggccggc cggcatggcc agtgtgtggg 2400 
attacgacct ggtactgatg gcggtttccc atctaaccga atccatgaac cgataccggg 2460 
aagggaaggg agacaagccc ggccgcgtgt tccgtccaca cgttgcggac gtactcaagt 2520 
tctgccggcg agccgatggc ggaaagcaga aagacgacct ggtagaaacc tgcattcggt 2580 
taaacaccac gcacgttgcc atgcagcgta cgaagaaggc caagaacggc cgcctggtga 2 640 
cggtatccga gggtgaagcc ttgattagcc gctacaagat cgtaaagagc gaaaccgggc 2700 
ggccggagta catcgagatc gagctagctg attggatgta ccgcgagatc acagaaggca 2760 
agaacccgga cgtgctgacg gttcaccccg attacttttt gatcgatccc ggcatcggcc 2820 
gtttfcctcta ccgcctggca cgccgcgccg caggcaaggc agaagccaga tggttgttca 2880 
agacgatcta cgaacgcagt ggcagcgccg gagagttcaa gaagttctgt ttcaccgtgc 2940 
gcaagctgat cgggtcaaat gacctgccgg agtacgattt gaaggaggag gcggggcagg 3000 
ctggcccgat cctagtcatg cgctaccgca acctgatcga gggcgaagca tccgccggtt 3 060 
cctaatgtac ggagcagatg ctagggcaaa ttgccctagc aggggaaaaa ggtcgaaaag 3120 
gtctctttcc tgtggatagc acgtacattg ggaacccaaa gccgtacatt gggaaccgga 3180 
acccgtacat tgggaaccca aagccgtaca ttgggaaccg gtcacacatg taagtgactg 3240 
atataaaaga gaaaaaaggc gatttttccg cctaaaactc tttaaaactt attaaaactc 3300 
ttaaaacccg cctggcctgt gcataactgt ctggccagcg cacagccgaa gagctgcaaa 3360 
aagcgcctac ccttcggtcg ctgcgctccc tacgccccgc cgcttcgcgt cggcctatcg 3420 
cggccgctgg ccgctcaaaa atggctggcc tacggccagg caatctacca gggcgcggac 3480 
aagccgcgcc gtcgccactc gaccgccggc gcccacatca aggcaccctg cctcgcgcgt 3540 
ttcggtgatg acggtgaaaa cctctgacac atgcagctcc cggagacggt cacagcttgt 3600 
ctgtaagcgg atgccgggag cagacaagcc cgtcagggcg cgtcagcggg tgttggcggg 3 660 
tgtcggggcg cagccatgac ccagtcacgt agcgatagcg gagtgtatac tggcttaact 3720 
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atgcggcatc agagcagatt gtactgagag tgcaccatat gcggtgtgaa ataccgcaca 3780 
gatgcgtaag gagaaaatac cgcatcaggc gctcttccgc ttcctcgctc actgactcgc 3 840 
tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt 3900 
tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg 3960 
ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg 4020 
agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat 4080 
accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta 4140 
ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct 4200 
gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc 4260 
ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa 4320 
gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg 4380 
taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact agaaggacag 4440 
tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt 4500 
gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta 4560 
cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc 4620 
agtggaacga aaactcacgt taagggattt tggtcatgca tgatatatct cccaatttgt 4680 
gtagggctta ttatgcacgc ttaaaaataa taaaagcaga cttgacctga tagtttggct 4740 
gtgagcaatt atgtgcttag tgcatctaac gcttgagtta agccgcgccg cgaagcggcg 4800 
tcggcttgaa cgaatttcta gctagacatt atttgccgac taccttggtg atctcgcctt 4860 
tcacgtagtg gacaaattct tccaactgat ctgcgcgcga ggccaagcga tcttcttctt 4920 
gtccaagata agcctgtcta gcttcaagta tgacgggctg atactgggcc ggcaggcgct 4980 
ccattgccca gtcggcagcg acatccttcg gcgcgatttt gccggttact gcgctgtacc 5040 
aaatgcggga caacgtaagc actacatttc gctcatcgcc agcccagtcg ggcggcgagt 5100 
tccatagcgt taaggtttca tttagcgcct caaatagatc ctgttcagga accggatcaa 5160 
agagttcctc cgccgctgga cctaccaagg caacgctatg ttctcttgct tttgtcagca 5220 
agatagccag atcaatgtcg atcgtggctg gctcgaagat acctgcaaga atgtcattgc 5280 
gctgccattc tccaaattgc agttcgcgct tagctggata acgccacgga atgatgtcgt 5340 
cgtgcacaac aatggtgact tctacagcgc ggagaatctc gctctctcca ggggaagccg 5400 
aagtttccaa aaggtcgttg atcaaagctc gccgcgttgt ttcatcaagc cttacggtca 5460 
ccgtaaccag caaatcaata tcactgtgtg gcttcaggcc gccatccact gcggagccgt 5520 
acaaatgtac ggccagcaac gtcggttcga gatggcgctc gatgacgcca actacctctg 5580 
atagttgagt cgatacttcg gcgatcaccg cttcccccat gatgtttaac tttgttttag 5640 
ggcgactgcc ctgctgcgta acatcgttgc tgctccataa catcaaacat cgacccacgg 57 00 
cgtaacgcgc ttgctgcttg gatgcccgag gcatagactg taccccaaaa aaacagtcat 5760 
aacaagccat gaaaaccgcc actgcgttcc atggacatac aaatggacga acggataaac 5820 
cttttcacgc ccttttaaat atccgattat tctaataaac gctcttttct cttaggttta 5880 
cccgccaata tatcctgtca aacactgata gtttaaactg aaggcgggaa acgacaatca 5940 
gatctagtag gaaacagcta tgaccatgat tacgccaagc ttgcatgcct gcaggtcgac 6000 
tctagactag tggatccgat atcgcccggg ctcgaggtac ccatcgcgat ccccgtcacc 60 60 
ggtgtgaggg aactagtttt gatcttgaaa gatcttttat ctttagagtt aagaactctt 6120 
tcgtattttg gtgaggtttt atcctcttga gttttggtca tagacctatt catggctctg 6180 
ataccaattt ttaagcgggg gcttatgcgg attatttctt aaattgataa ggggttatta 6240 
gggggtatag ggtataaata caagcattcc cttagcgtat agtataagta tagtagcgta 63 00 
cctctatcaa atttccatct tcttaccttg cacagggcct gcaaccttat ccttccttgt 63 60 
cttcctcctt ccttccgtcc acttcatcat atttaaacca aacctacggg ggagtcaacg 6420 
taaccaaccc tgccttagca tcttttccct aacggcctcc tgcctaagcg gtacttctag 6480 
cttcgaacgg cgtctgggct ccaggtttag tcgtctcgtg tctggtttat attcacgaca 6540 
aagatctata gggactttag gagatctgga ttttagtact ggattttggt tttaggaatt 6600 
agaaatttta ttgatagaag tattttacaa atacaaatac atactaaggg tttcttatat 6660 
gctcaacaca tgagcgaaac cctataagaa ccctaanttc cccttatcgg gaaactactc 6720 
acacattatt tatggagaaa atagagagag atagatttgt agagagagac tggtgatttc 6780 
agcgtaccga attcggctaa cagtgtcgaa taacgcttta caaacaatta ttaacgcccg 6840 
gttaccaggc gaagaggggc tgtggcagat tcatctgcag gacggaaaaa tcagcgccat 6900 
tgatgcgcaa tccggcgtga tgcccataac tgaaaacagc ctggatgccg aacaaggttt 6960 
agttataccg ccgtttgtgg agccacatat tcacctggac accacgcaaa ccgccggaca 7020 
accgaactgg aatcagtccg gcacgctgtt tgaaggcatt gaacgctggg ccgagcgcaa 7080 
agcgttatta acccatgacg atgtgaaaca acgcgcatgg caaacgctga- aatggcagat 7140 
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tgccaacggc attcagcatg tgcgtaccca tgtcgatgtt tcggatgcaa cgctaactgc 7200 
gctgaaagca atgctggaag tgaagcagga agtcgcgccg tggattgatc tgcaaatcgt 7260 
cgccttccct caggaaggga ttttgtcgga tccggtgata cctgcacatc aacaaatttt 7320 
ggtcatatat tagaaaagtt ataaattaaa atatacacac ttataaacta cagaaaagca 7380 
attgctatat actacattct tttattttga aaaaaatatt tgaaatatta tattactact 7440 
aattaatgat aattattata tatatatcaa aggtagaagc agaaacttac gtagtcgacg 7500 
acaaaatccc ttcctgaggg aaggcgacga tttgcagatc aatccacggc gcgacttcct 7560 
gcttcacttc cagcattgct ttcagcgcag ttagcgttgc atccgaaaca tcgacatggg 7620 
tacgcacatg ctgaatgccg ttggcaatct gccatttcag cgtttgccat gcgcgttgtt 7 680 
tcacatcgtc atgggttaat aacgctttgc gctcggccca gcgttcaatg ccttcaaaca 7740 
gcgtgccgga ctgattccag ttcggttgtc cggcggtttg cgtggtgtcc aggtgaatat 7800 
gtggctccac aaacggcggt ataactaaac cttgttcggc atccaggctg ttttcagtta 7860 
tgggcatcac gccggattgc gcatcaatgg cgctgatttt tccgtcctgc agatgaatct 7920 
gccacagccc ctcttcgcct ggtaaccggg cgttaataat tgtttgtaaa gcgttattcg 7980 
acactgttag ccaagcttgc atgcctgcag gtcgagtctt tgttttttac tttggttcat 8040 
gacactcaga gacttgagag aagcaatata tagacttttt tttgtttttt ttttgtggtc 8100 
acgtttattt tcctattgga gacggtaacg aagatcgaac ctgtggtgga aatgaaacaa 8160 
ggtgggacta gcccacgtgg tttcttttct ctgcattgat ttgtttttgt tttttttgta 8220 
aagttcacat caaacctact aataattgag aagaaaaata aaatctattg attgattaaa 8280 
ccagccgatg ctttatgtct gaatataaaa aagaagtgaa aaccccgttt aagaattaca 8340 
acggtggttt acaaagtatt tggacacaat aaatccaaac gaaataaaac aaaatggaga 8400 
actaccaaat aaaaaacaaa taaaaaactt aaaagaattt attccatttt ttttcccgta 8460 
gaatttattc ttttatggat tccttaaatc catatttgat gcattttgat tcctcataat 8520 
aggtaataat atatactatg ttatagatat gtttctaatt cgtattaacc tacctttttt 8580 
tggtcgtacg attctaccta ataatattga acggaattga tgttttggac cacttagaaa 8640 
gtattttttt tttggtttgt cttagctgta tttcattaaa tataaattta aataagaaat 8700 
gtcataaata aaatttgacg tatagatttt ttaaatccat tttatgttat ttaatatttg 8760 
aaatgtgagt ttggctccta tttaatctta ggatgggtta atactaagtt ttccttaatg 8820 
aattatctca gagaaactgg attaaataaa ctaaaaaata gatcaatgtg ttttggtccg 8880 
gtcaaatatc tttggattta ctattattgg cgaaaagaaa gtctcatata gtaaatcata 8940 
ttcctacaag agaaatcaaa atttttgaat taacatggat tgtatagttt cttatataac 9000 
caattagttc gcatcaagaa aaccaaaccc caattaataa tcaaacgggc ttggtaggaa 9060 
tatttcattg cagctttcag ataaaagaaa aaaacacaca ctcaagtctt ttatttcatc 912 0 
tttcttactt gcaggaactc aaattccact ttgccacttt tctttacaaa taaacacaaa 9180 
ttgtcaatga aacgaaatag tctttttatg caaacactgt ttgtcttttt tcgatcacgt 9240 
ttctgattgt gacagccatc catatatata gggaatgtaa aacaacaaca tgtgaagtca 9300 
catatacgta atggtttagc atagcttcta ttttcgttgt caatattagt cattccaaaa 9360 
catttttaag aaaaataaat taatatatgt atattcttgg aactaatgta tgtggaaata 9420 
cagtaactta attattaaac attctaaatg caaatatgca aagaaaaaaa agaaaagaac 9480 
acaactgaaa tcaaagccag attcataata attggctaca tggttgtaga atgtagggta 9540 
acacaacatc cagaattgaa cactcaaatt ggatgataga tggataatct ttagatacaa 9600 
gagaattggt tctcttccat tattaacgaa aataaagaaa aaaagtttag cataaaagtt 9660 
tgaaactcaa cataacattt tgaacttgac tccttcatag gagtgacatg aactgacgaa 9720 
tcacaaccga ttacttgttt gagtcatctt ccgctttctc caccttcgaa atgaatgtga 9780 
ccggtttctt cgggtgctca tttacggtca agtgtaaaac atctggtctc gacgagct 9838 
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